{"id":1026,"date":"2014-06-24T14:10:14","date_gmt":"2014-06-24T17:10:14","guid":{"rendered":"http:\/\/blog.scielo.org\/es\/?p=1026"},"modified":"2019-05-02T14:50:25","modified_gmt":"2019-05-02T17:50:25","slug":"que-son-las-public-library-of-science-collections-parte-ii","status":"publish","type":"post","link":"https:\/\/blog.scielo.org\/es\/2014\/06\/24\/que-son-las-public-library-of-science-collections-parte-ii\/","title":{"rendered":"\u00bfQu\u00e9 son las Public Library of Science Collections? \u2013 Parte II"},"content":{"rendered":"<p><em><img loading=\"lazy\" decoding=\"async\" class=\"alignright wp-image-1028 size-medium\" src=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2014\/06\/plos1-300x120.png\" alt=\"plos\" width=\"300\" height=\"120\" srcset=\"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2014\/06\/plos1-300x120.png 300w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2014\/06\/plos1.png 389w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/>PLOS Collections\u00b9<\/em> es una secci\u00f3n especial de la iniciativa <em>Public Library of Science<\/em> (PLOS<em>)<\/em> que presenta colecciones de art\u00edculos seleccionados por parte de este Sitio que es uno de los l\u00edderes del movimiento de Acceso Abierto (AA) a la publicaci\u00f3n cient\u00edfica.<\/p>\n<p>Se presentan en <em>PLOS Collections<\/em> siete \u00e1reas tem\u00e1ticas como ser la biolog\u00eda, la medicina, la gen\u00e9tica, las enfermedades tropicales, etc., pero en particular queremos destacar en esta oportunidad dos sub-colecciones importantes para aquellos que estamos interesados en general en el AA y las posibilidades que se abren desde el punto de vista de las ciencias de la informaci\u00f3n.<\/p>\n<p>En el post anterior se presentaron en forma breve algunos documentos destacados sobre el tema <em>Open Access Collection\u00b2<\/em>, en este post destacaremos otras dos \u00e1reas especiales, que son la Miner\u00eda de Datos (<em>Text Mining\u00b3<\/em>) y la Altmetr\u00eda\u2074.<\/p>\n<p>Estas dos especialidades, potenciadas por el acceso libre a los textos completos, son las que permitir\u00e1n en el futuro pr\u00f3ximo mejorar incre\u00edblemente los sistemas de recuperaci\u00f3n de informaci\u00f3n (por la implementaci\u00f3n de la web sem\u00e1ntica) y disponer de mediciones de la importancia y relevancia de la producci\u00f3n cient\u00edfica como alternativas al famoso (y criticado) Factor de Impacto.<\/p>\n<h3>Text Mining Collection<\/h3>\n<p>Esta colecci\u00f3n de PLOS es muy interesante para los especialistas en ciencias de la informaci\u00f3n, en particular los que se interesan en interfaces avanzadas de recuperaci\u00f3n dentro de los conceptos de la Web Sem\u00e1ntica.<\/p>\n<p>La Miner\u00eda de Textos (<em>Text Mining<\/em>) no es un \u00e1rea de investigaci\u00f3n precisamente nueva, pues los conceptos te\u00f3ricos han sido estudiados desde los mismos or\u00edgenes de la computaci\u00f3n. Pero el hecho de disponer hoy d\u00eda de vol\u00famenes importantes de textos completos, con acceso abierto, y estructurados bajo est\u00e1ndares abiertos, ha permitido avanzar desde la teor\u00eda en los laboratorios de computaci\u00f3n a la pr\u00e1ctica con productos reales y eficientes.<\/p>\n<p>La Wikipedia\u2075 explica de manera sencilla que la <em>miner\u00eda de texto<\/em> es el proceso de derivar informaci\u00f3n del alta calidad a partir de los mismos textos. Esta informaci\u00f3n se obtiene a trav\u00e9s del estudio estad\u00edstico de patrones de texto, del cual es posible extraer conceptos, su valor de novedad y grado de inter\u00e9s, las asociaciones significativas entre diferentes <em>corpus<\/em> de texto, y tambi\u00e9n mejorar la relevancia en la recuperaci\u00f3n de informaci\u00f3n.<\/p>\n<p>La Colecci\u00f3n PLOS de <em>Text Mining<sup>3,6<\/sup><\/em> explica que el objetivo de esta \u00e1rea de investigaci\u00f3n es resolver los problemas relativos a la recuperaci\u00f3n, la extracci\u00f3n y el an\u00e1lisis de la informaci\u00f3n no estructurada en el texto digital, y de ese modo revolucionar la forma de acceder e interpretar los datos que podr\u00edan haber quedado sumergidos en la literatura. Se ofrecen en esta colecci\u00f3n que describimos dos art\u00edculos de introducci\u00f3n al tema \u201c<em>Getting Started in Text Mining<sup>7,8<\/sup><\/em>\u201d, para los no especialistas.<\/p>\n<p>En el documento \u201c<em>Open Access: Taking Full Advantage of the Content<sup>6<\/sup><\/em>\u201d,se explica la importancia que tiene que los editores preparen los textos de los originales digitales estructurados con lenguajes de marcado en XML, como los usados por la <em>National Library of Medicine<\/em>, y ajustados a una DTD especial con extensiones adecuadas para las necesidades de la disciplina, pues es posible entonces extraer significados sem\u00e1nticos e integrarlos a las bases de datos de la literatura.<\/p>\n<p>Por \u00faltimo se ofrece un documento de ejemplo de la utilidad del marcado de texto con XML aplicado a un caso real, <em>\u201cBiomedical Text Mining and Its Applications<sup>9<\/sup>\u201d.<\/em><\/p>\n<p>Es interesante notar que en un reciente post de SciELO en perspectiva &#8211; \u201c<em>\u00bfPorqu\u00e9 XML<\/em><em>?<sup>10<\/sup>\u201d<\/em> &#8211; se anuncia que precisamente el lenguaje de marcado en XML es uno de los avances tecnol\u00f3gicos recientes de SciELO que se est\u00e1 implementando.Para el cumplimiento del objetivo del <em>text mining<\/em>, SciELO integra el XML usado para la preparaci\u00f3n de las revistas y libros de sus colecciones, la DTD JATS que es precisamente la usada en PMC de NLM para el marcado de textos de acuerdo a la norma NISO.<\/p>\n<p>Vea adem\u00e1s el libro <em>SciELO: 15 A\u00f1os de Acceso Abierto (Un estudio anal\u00edtico sobre Acceso Abierto y comunicaci\u00f3n cient\u00edfica)<\/em>, en particular el <em>Cap\u00edtulo 5 \u2013 Producci\u00f3n de la colecci\u00f3n y revistas SciELO<\/em>.<\/p>\n<h3>Altmetrics Collection<\/h3>\n<p>La Altmetr\u00eda es el estudio y el uso de medidas de impacto acad\u00e9mico no tradicionales, que se basan en la actividad en el ambiente Web. A medida que la actividad acad\u00e9mica se mueve hacia el espacio online, estas m\u00e9tricas rastrean las interacciones y la actividad generando datos de mayor granularidad, permitiendo a los investigadores y a los responsables de pol\u00edticas generar un cuadro de mayor resoluci\u00f3n sobre el impacto acad\u00e9mico de la investigaci\u00f3n<\/p>\n<p>La colecci\u00f3n PLOS de Altmetr\u00eda, re\u00fane un corpus emergente de esta investigaci\u00f3n para alentar los estudios y el uso de la altmetr\u00eda. La intenci\u00f3n es cubrir un amplio abanico de temas incluyendo los an\u00e1lisis estad\u00edsticos de las fuentes de datos altm\u00e9tricos, la validaci\u00f3n de las medidas, y la identificaci\u00f3n de los sesgos de esas medidas, la validaci\u00f3n de modelos de descubrimiento y poder hacer recomendaciones basadas en la altmetr\u00eda.<\/p>\n<p>Para hacer frente a la cantidad creciente de informaci\u00f3n, los investigadores siempre han usado filtros para seleccionar lo m\u00e1s relevante. Los filtros tradicionalmente incorporan como uno de sus componentes los an\u00e1lisis de citas y factores de impacto. Pero al igual que la indexaci\u00f3n manual que se practicaba hace 60 a\u00f1os, hoy d\u00eda los vol\u00famenes de la literatura requieren nuevos procedimientos que est\u00e9n acompasados a la velocidad y a la diversidad. Como se sabe, los an\u00e1lisis de citaciones pueden estar sesgados, son lentos en acumularse, y pasan por alto los impactos sociales cada vez m\u00e1s importantes.<\/p>\n<p>La comunidad cienciom\u00e9trica est\u00e1 consciente de la insuficiencia de las medidas de citaci\u00f3n, y recientemente ha propuesto m\u00e9todos para reunir informaci\u00f3n m\u00e1s amplia acerca de esos impactos y proporcionar m\u00e1s detalles sobre el sistema de publicaci\u00f3n cient\u00edfica. Gracias a la Web, la cienciometr\u00eda ha comenzado a investigar algunos filtros que podr\u00edan ser prometedores.<\/p>\n<table>\n<tbody>\n<tr>\n<td><strong>Instrumento<\/strong><\/td>\n<td><strong>ejemplo<\/strong><\/td>\n<\/tr>\n<tr>\n<td>social media<\/td>\n<td>Twitter y Facebook<\/td>\n<\/tr>\n<tr>\n<td>administradores de referencias<\/td>\n<td>CiteULike, Zotero, y Mendeley<\/td>\n<\/tr>\n<tr>\n<td>enciclopedias colaborativas<\/td>\n<td>Wikipedia<\/td>\n<\/tr>\n<tr>\n<td>blogs<\/td>\n<td>acad\u00e9micos y para p\u00fablico general<\/td>\n<\/tr>\n<tr>\n<td>Redes sociales acad\u00e9micas<\/td>\n<td>ResearchGate o Academia.edu<\/td>\n<\/tr>\n<tr>\n<td>Sitios de organizaci\u00f3n de conferencias<\/td>\n<td>Lanyrd.com<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>&nbsp;<\/p>\n<p>La colecci\u00f3n <em>Altmetrics<\/em> de PLOS incluye trabajos que eval\u00faan los an\u00e1lisis estad\u00edsticos y las validaciones m\u00e9tricas de las bases de datos que recopilan esta clase de informaci\u00f3n. Tambi\u00e9n la fundamentaci\u00f3n te\u00f3rica del uso de la altmetr\u00eda, y las comparaciones de estos resultados con los m\u00e9todos tradicionales de la cienciometr\u00eda. El art\u00edculo <em>What Can Article-Level Metrics Do for You?<sup>11<\/sup><\/em> ilustra con ejemplos para qu\u00e9 nos sirven estas nuevas medidas.<\/p>\n<p>Por supuesto que todos nosotros en tiempos recientes ya hemos visto y le\u00eddo presentaciones sobre la altmetr\u00eda y los supuestos beneficios que tendremos en el corto plazo, pero la pregunta que surge naturalmente frente a cualquier novedad es, si esto realmente funciona o ser\u00e1 una de tantas modas pasajeras. \u00bfSer\u00e1 verdad que la altmetr\u00eda hace todo lo que se dice? Esta pregunta es motivo del trabajo publicado recientemente en la Altmetrics Collection: <em>Do Altmetrics Work? Twitter and Ten Other Social Web Services<sup>12<\/sup><\/em><\/p>\n<p>Dice el art\u00edculo que a pesar de que existe una gran promoci\u00f3n sobre el uso de las medidas altm\u00e9tricas como indicadores tempranos de futuro impacto y utilidad de una publicaci\u00f3n, todav\u00eda no disponemos de evidencias sistem\u00e1ticas que muestren una correlaci\u00f3n significativa para ser usados como reales indicadores alternativos. Hasta ahora la literatura publicada ha consistido en estudios de casos para algunas \u00e1reas de investigaci\u00f3n y unas pocas revistas. El trabajo que comentamos investig\u00f3 los indicadores altm\u00e9tricos para m\u00e1s de 200 mil art\u00edculos de PubMed publicados en 1.891 revistas. Se encontraron buenas correlaciones entre los art\u00edculos con altos \u00edndices de citaci\u00f3n y valores altm\u00e9tricos importantes provenientes de Twitter, Facebook, blogs, sin embargo hay baja correlaci\u00f3n con Google+, y la evidencia es insuficiente con LinkedIn, Pinterest y Reddit. Por otra parte para los art\u00edculos sin valores altm\u00e9tricos no fue posible establecer ninguna correlaci\u00f3n. En general las correlaciones con Twitter son las mejores, pero para el resto en general son bajas y no es claro si ser\u00e1n suficientemente prevalentes para ser usadas en la pr\u00e1ctica.<\/p>\n<h3>Reflexiones<\/h3>\n<p>El AA ha abierto nuevas \u00e1reas de investigaci\u00f3n y estamos comenzando a ver productos que todav\u00eda deber\u00e1n ser evaluados e incorporados como herramientas. <em>PLOS Collections<\/em> es un sitio al que vale la pena volver peri\u00f3dicamente para ver c\u00f3mo se desarrolla el futuro de la informaci\u00f3n.<\/p>\n<p>SciELO en Perspectiva seguir\u00e1 publicando a lo largo del a\u00f1o actualizaciones del estado del arte de la ciencia de la informaci\u00f3n.<\/p>\n<h3>Notas<\/h3>\n<p>\u00b9 Qu\u00e9 son las PLOS Collections &#8211; <a href=\"http:\/\/www.ploscollections.org\/;jsessionid=7E86FB385236F1DD3425171788D264AB\">http:\/\/www.ploscollections.org\/;jsessionid=7E86FB385236F1DD3425171788D264AB<\/a><\/p>\n<p>\u00b2 Open Access Collection &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v01.i10\">http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v01.i10<\/a><\/p>\n<p>\u00b3 Text Mining Collection &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v01.i14\">http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v01.i14<\/a><\/p>\n<p>\u2074 Altmetrics Collection &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v02.i19\">http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v02.i19<\/a><\/p>\n<p>\u2075 Wikipedia \u2013 text mining &#8211; <a href=\"http:\/\/en.wikipedia.org\/wiki\/Text_mining\">http:\/\/en.wikipedia.org\/wiki\/Text_mining<\/a><\/p>\n<p><sup>6 <\/sup>Open Access: Taking Full Advantage of the Content &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000037\">http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000037<\/a><\/p>\n<p><sup>7 <\/sup>Getting Started in Text Mining &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.0040020\">http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.0040020<\/a><\/p>\n<p><sup>8 <\/sup>Getting Started in Text Mining: Part Two &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000411\">http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000411<\/a><\/p>\n<p><sup>9 <\/sup>Biomedical Text Mining and Its Applications &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000597\">http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000597<\/a><\/p>\n<p><sup>10 <\/sup><em>\u00bfPorqu\u00e9 XML?<\/em>. SciELO en Perspectiva. [viewed 24 June 2014]. Available from: <a href=\"http:\/\/blog.scielo.org\/es\/2014\/04\/04\/porque-xml\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/blog.scielo.org\/es\/2014\/04\/04\/porque-xml\/<\/a><\/p>\n<p><sup>11 <\/sup>What Can Article-Level Metrics Do for You? &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pbio.1001687\">http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pbio.1001687<\/a><\/p>\n<p><sup>12 <\/sup>Do Altmetrics Work? Twitter and Ten Other Social Web Services &#8211; <a href=\"http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pone.0064841\">http:\/\/www.ploscollections.org\/article\/info%3Adoi%2F10.1371%2Fjournal.pone.0064841<\/a><\/p>\n<h3>Referencias<\/h3>\n<p><em>\u00bfQu\u00e9 son las Public Library of Science Collections? \u2013 Parte I. SciELO en Perspectiva. [viewed 24 June 2014]. Available from: <a href=\"http:\/\/blog.scielo.org\/es\/2014\/06\/03\/que-son-las-public-library-of-science-collections-parte-i\/\">http:\/\/blog.scielo.org\/es\/2014\/06\/03\/que-son-las-public-library-of-science-collections-parte-i\/<\/a><\/em><\/p>\n<p>PACKER, AL. <em>et al, <\/em>orgs<em>.<\/em>SciELO: 15 A\u00f1os de Acceso Abierto (Un estudio anal\u00edtico sobre Acceso Abierto y comunicaci\u00f3n cient\u00edfica). Paris: UNESCO, 2014.<\/p>\n<p>Tenth Anniversary PLOS Biology Collection. <em>PLOS Collection. <\/em>Available from<em>: <\/em><a href=\"http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v06.i03\">http:\/\/www.ploscollections.org\/article\/browse\/issue\/info%3Adoi%2F10.1371%2Fissue.pcol.v06.i03<\/a><\/p>\n<h3>Enlace externo<\/h3>\n<p>PLOS &#8211; <a href=\"http:\/\/www.plos.org\/\">http:\/\/www.plos.org\/<\/a><\/p>\n<p>&nbsp;<\/p>\n<h3><a href=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak.jpg\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright wp-image-537\" title=\"Ernesto Spinak\" src=\"http:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-300x271.jpg\" alt=\"Ernesto Spinak\" width=\"180\" height=\"163\" srcset=\"https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-300x271.jpg 300w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-768x694.jpg 768w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-1024x926.jpg 1024w, https:\/\/blog.scielo.org\/es\/wp-content\/uploads\/sites\/3\/2013\/10\/spinak-150x136.jpg 150w\" sizes=\"auto, (max-width: 180px) 100vw, 180px\" \/><\/a>Sobre Ernesto Spinak<\/h3>\n<p>Colaborador del SciELO, Ingeniero en Sistemas y Lic. en Biblioteconom\u00eda, con Diploma de Estudios Avanzados pela Universitat Oberta de Catalunya y Maestr\u00eda en &#8220;Sociedad de la Informaci\u00f3n&#8221; por la Universidad Oberta de Catalunya, Barcelona &#8211; Espa\u00f1a. Actualmente tiene una empresa de consultor\u00eda que atiende a 14 instituciones de gobierno y universidades en Uruguay con proyectos de informaci\u00f3n.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Se presenta en este post la segunda parte de la descripci\u00f3n de los contenidos de la <i>PLOS Collections<\/i>. De las siete colecciones que la integran, se han seleccionado <i>Text Mining<\/i> y <i>Altmetrics<\/i> donde se analiza brevemente sus contenidos e importancia que tiene para la cienciometr\u00eda y las ciencias de la informaci\u00f3n, el crecimiento de estas disciplinas potenciadas por el acceso libre a textos completos. <span class=\"ellipsis\">&hellip;<\/span> <span class=\"more-link-wrap\"><a href=\"https:\/\/blog.scielo.org\/es\/2014\/06\/24\/que-son-las-public-library-of-science-collections-parte-ii\/\" class=\"more-link\"><span>Read More &rarr;<\/span><\/a><\/span><\/p>\n","protected":false},"author":8,"featured_media":1029,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":"","_links_to":"","_links_to_target":""},"categories":[3],"tags":[18,30,45],"class_list":["post-1026","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-analisis","tag-acceso-abierto","tag-altmetria","tag-creative-commons"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/1026","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/comments?post=1026"}],"version-history":[{"count":5,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/1026\/revisions"}],"predecessor-version":[{"id":3258,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/posts\/1026\/revisions\/3258"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media\/1029"}],"wp:attachment":[{"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/media?parent=1026"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/categories?post=1026"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.scielo.org\/es\/wp-json\/wp\/v2\/tags?post=1026"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}