“El acceso abierto a las publicaciones científicas en la Comunidad de Madrid” Cursos de verano 2006 El Escorial, Universidad Complutense Marco del proyecto Constituye una de las líneas de actividad del Programa de Cooperación Interbibliotecaria enmarcado en el Contrato Programa entre la CAM y las Universidades, para la regulación del marco de cooperación en el Sistema Regional de Investigación Científica e Innovación Tecnológica IV PRICIT (20052008). Nuestro proyecto Una iniciativa conjunta de las Universidades del Consorcio Madroño (Universidades públicas de Madrid y la UNED) y de la Comunidad de Madrid para crear una plataforma digital de acceso libre a la producción científica de las Instituciones de investigación de la Comunidad de Madrid. Plazo de ejecución: 2005-2008 Sus objetivos Dar soporte a las iniciativas de comunicación científica en acceso abierto de los investigadores de la Comunidad de Madrid. Ofrecer un espacio de acceso abierto a la ciencia y el conocimiento. Incrementar la difusión, la visibilidad y el impacto de la investigación científica madrileña. Modelo datos/servicios Nivel de datos: infraestructura de adquisición, organización, gestión, almacenamiento y disponibilidad de los contenidos. Nivel de servicios: construcción de servicios sobre la agregación de los contenidos disponibles en la infraestructura de datos. Modelo datos/servicios: soportado sobre el protocolo OAI-PMH Nivel de datos: red de repositorios institucionales Nivel de servicios: proveedor de servicios/portal web Modelo:datos/servicios Responsabilidades individuales/acciones conjuntas: Cada Institución es responsable de su propio repositorio, tiene sus propias motivaciones para crearlo y decide cómo quiere organizarlo: es el responsable de tener los contenidos seguros y disponibles. Las acciones conjuntas se centran en aquellas que aseguren la interoperabilidad y la integración de estos repositorios a todos los niveles para que sea posible la construcción de los servicios. Nivel de datos Repositorios participantes Arquitectura Tecnología Contenidos Cuestiones legales Apoyo institucional Políticas ¿Qué es un repositorio institucional? “Un conjunto de servicios que una Institución ofrece a los miembros de su comunidad para la gestión y la difusión de los materiales digitales creados por la Institución y la comunidad de sus miembros. Esencialmente supone un compromiso de organización para el control de esos contenidos, incluyendo su preservación en el tiempo así como su organización y acceso o distribución” Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age by Clifford A. Lynch, 2003 Características Un repositorio institucional consiste en hardware, software, datos y procedimientos que: Contiene objetos digitales que representan cualquier tipo de producción científica de una Institución de investigación y ciencia. Asegura la identificación persistente del objeto mediante los metadatos y un identificador único persistente. Ofrece funciones de gestión y archivo de los objetos Proporciona un acceso fácil y estandarizado, aumentando así su visibilidad e interoperabilidad Ofrece los sistemas adecuados de seguridad para los objetos y los metadatos. ¿Qué es un repositorio institucional abierto? El mismo repositorio pero que además permite a sus usuarios el acceso libre a sus contenidos Un repositorio conforme con el protocolo OAIPMH, es decir, un servidor capaz de responder a las peticiones de un “harvester” Desde la perspectiva del “open access” “Green road”: una de las rutas hacia el acceso abierto según el acuerdo de Budapest, en la que los autores continúan publicando en las revistas científicas de suscripción tradicionales y de forma paralela AUTO-ARCHIVAN esos trabajos en archivos abiertos (entre otros los repositorios institucionales que les proporcione su institución) Repositorios participantes (por ahora) Universidad de Alcalá Universidad Autónoma de Madrid Universidad Carlos III de Madrid Universidad Complutense de Madrid Universidad Nacional de Educación a Distancia Universidad Politécnica de Madrid Universidad Rey Juan Carlos + Un archivo abierto independiente creado para alojar los contenidos de científicos e investigadores que no dispongan de repositorio institucional o que así lo decidan. Arquitectura distribuida abierta ¿Por qué no hemos creado un solo repositorio para todos? No existe una única solución que sirva para todos. Existe el protocolo OAI-PMH. Además... Arquitectura: otras razones Escalabilidad Internacionalidad Su carácter institucional Integración Los propios fines de un repositorio institucional El auto-archivo Arquitectura: escalabilidad Crear un único repositorio centralizado no es una arquitectura viable ya que no escalaría bien dado el tamaño y número potenciales de objetos digitales que se acumularán con el tiempo. Arquitectura: internacionalidad El modelo distribuido es el subyacente a la tecnología abierta y sigue la dirección de la mayoría de los proyectos que se han desarrollado internacionalmente en relación con el acceso abierto. Arquitectura: institucionalidad Permite a cada nodo o repositorio de la red la definición de sus propias políticas locales en relación con la gestión de sus contenidos y ofrece una herramienta básica para garantizar un almacenamiento digital estructurado fiable de su propia propiedad intelectual. Arquitectura: integración La arquitectura distribuida facilita la integración de otros nodos a la red que pueden no tener la naturaleza institucional, por ejemplo los archivos abiertos disciplinarios o pertenecer a Instituciones con otras características, por ejemplo hospitales, que no se adaptarían bien a un repositorio institucional centralizado. Permite, además, a cada nodo de la red su integración independiente en otras redes. Arquitectura: fines de un repositorio institucional El “open access” no es el único fin por el que una Institución crea un repositorio institucional. Dar visibilidad y difusión a los resultados de su actividad científica y académica con una cierta imagen de “marca”: ser indicador de prestigio. Asegurar la preservación de su producción intelectual Ofrecer una visión contextualizada de su actividad científica. Ofrecer a su comunidad una herramienta de gestión de sus contenidos digitales. Arquitectura: auto-archivo Es más fácil si estamos cerca de donde se crean y se auto-archivan los contenidos. Distribuidos, pero juntos ¿Por qué juntos? - Podemos ofrecer una visión global de la ciencia de nuestra región Supone una muestra más significativa de lo que está sucediendo en las distintas disciplinas científicas - Es más fácil conseguir financiación - Se tiene más peso específico y por tanto más fuerza cuando hay que convencer o pedir. - Las políticas necesarias para que el acceso abierto sea posible se facilitan si el proyecto es colectivo. - Se alcanza más rápidamente una masa crítica de contenidos Qué tecnología El proyecto no establece ninguna imposición respecto a la tecnología utilizada salvo: - Que sea conforme con el protocolo OAI-PMH - Que utilice las herramientas disponibles en el contexto de la OAI (Open Archive Initiative) - Que esté construido con estándares abiertos y aceptados internacionalmente. Software Sigue funcionando la regla de que no hay una única solución válida para todos: - Dspace - Eprints CÓDIGO ABIERTO - Fedora * Digitools Software de código abierto Programas que permiten acceder a los códigos fuente. ejecutar el programa para cualquier propósito estudiar, modificar y distribuir libremente el original,copias y modificaciones (haciendo constar quién las ha hecho) El código abierto es una nueva forma de construir software Ventajas del código abierto Evoluciona más rápida y orgánicamente: muchos individuos y equipos trabajando en paralelo e intercambiando conocimiento Responde mejor a las mejoras y desarrollos locales (no responden a intereses comerciales) Nuevas versiones más frecuentes La seguridad se mejora porque el código está expuesto al mundo. Ahorra costes (no es gratis, pero permite diferentes tipos de decisiones presupuestarias) Podemos desarrollar nuevas funcionalidades a nuestro propio ritmo Software de código abierto disponible A Guide to Institutional Repository Software v 3.0 Contenidos De carácter erudito: tanto de naturaleza científica como académica Producido, enviado o patrocinado por un miembro de la comunidad científica o cualquier otro agente autorizado por la política de la Institución No efímero: el trabajo debe estar completo y preparado para su distribución Licenciado a perpetuidad: el autor debe ser capaz y tener la voluntad de ceder, no en exclusiva, a la Institución el derecho a preservar y distribuir su trabajo a través del repositorio Contenidos Equivalentes a los impresos: artículos de revistas, ponencias, tesis, capítulos de libros, informes técnicos, monografías... (e-prints) Contenidos audiovisuales, multimedia, imágenes... Contenidos: "eprints" = preprints + postprints. Un “eprint” es la versión digital de un documento científico (generalmente un artículo, pero puede ser también una tesis, una ponencia, un capítulo de libro o un libro) que es accesible en línea normalmente a traves de un archivo o repositorio digital (ya sea institucional, disciplinario o de cualquier otro tipo) El término "eprint" abarca tanto el término “preprint” (el documento antes de ser revisado por pares) como postprints (después de haber sido revisado Distinguiremos entre aquellos documentos depositados que han sido revisados por pares y aquellos que no lo han sido para garantizar a los autores y usuarios la certificación científica de los contenidos. Contenidos Objetos de aprendizaje: generados en el contexto del “elearning”: otros esquemas de metadatos, otra mentalidad, otras necesidades de uso y reutilización, otras funciones, más complejidad en el tema del copyright y el acceso abierto. Es esencial que nuestros repositorios sean capaces de integrarse en un servicio transparente: interoperabilidad. Objetos generados en el contexto de la “e-ciencia”: datasets. Repositorios de data. Requieren urgente análisis si queremos realmente dar cobertura al proceso integral de las nuevas formas de hacer ciencia en el contexto de la tecnología Grid. “llenar”de contenidos los repositorios Mecanismos de alimentación directa de los repositorios: “auto-archivo” (muy trabajoso) Cargas de colecciones digitales de la biblioteca u otras ya existentes en la Universidad. Procesos de digitalización retrospectiva: hemos empezado con las tesis y las revistas. Cuestiones legales Licencia de depósito: dictámenes de las respectivas asesorías jurídicas/licencias por defecto en los propios programas. El acuerdo entre la Institución y el autor para la preservación, organización y distribución a través del repositorio de los contenidos. Licencia de uso: el acuerdo entre el autor y el usuario final para el uso de los contenidos: “creative commons”, “science commons” Cuestiones legales: las editoriales Aproximadamente el 94% de las principales editoriales científicas del mundo permiten algún tipo de auto-archivo en repositorios institucionales SHERPA Políticas Cada repositorio define las políticas locales respecto a sus condiciones de auto-archivo, quién puede hacerlo, condiciones para la preservación, organización de los contenidos, procedimientos, etc. De nuevo, el único compromiso, respecto al proyecto común es asegurar la interoperabilidad y el acceso abierto a los contenidos. Nivel de servicios Los repositorios deben ser considerados dentro de un contexto de información más amplio. Crear una pequeña escala de silos de información dentro de los repositorios no es una gestión de la información muy estratégica en la era “Google” La promesa de que los repositorios institucionales servirán de soporte a la realización del “open access” y mejorarán la comunicación científica depende de la existencia de proveedores de servicios externos que exploten el conjunto de redes de repositorios institucionales a escala global. Para cumplir esta promesa los servicios deben ser construidos sobre una agregación coherente de contenidos provenientes de una red de repositorios institucionales Nivel de servicios Un servidor para el proveedor de servicios, alojado y mantenido en la sede del Consorcio Madroño Un portal web de acceso a la interfaz de búsqueda del proveedor de servicios + valores añadidos, alojado, creado y mantenido por la Comunidad de Madrid en su espacio Madri+d El proveedor de servicios Hemos utilizado el software ARC –código abierto- (es el mismo que utiliza el servicio OAISTER) El responsable de Madroño trabaja directamente en el desarrollo de mejoras y nuevas propuestas del software con su creador Xiaoming Liu. El proveedor de servicios recolectará los metadatos de los repositorios participantes y, en fases sucesivas, podrá recolectar aquellos repositorios disponibles que considere oportuno incluir en el portal. El proveedor de servicios podrá ser también proveedor de datos para otros proveedores de servicios. Los metadatos serán recuperables también por Google Servicios sobre los metadatos recolectados Búsqueda simple (ya lo ofrece ARC) Búsquedas avanzadas (por campos) (ya lo ofrece ARC) El punto fuerte que queremos ofrecer es la definición de SETS para permitir la navegación organizada por subcolecciones de materias y tipos de documentos. Los sets permitirán dar una muestra significativa del peso específico de una determinada disciplina en el conjunto de la ciencia de la Comunidad de Madrid. Otros servicios en fases sucesivas Generación y visualización de estadísticas integrada Herramienta de citas Búsqueda a texto completo Generación de presentación de contenidos personalizada Herramientas para la creación colaborativa de documentos Sistema de búsqueda y recuperación multilingüe Control de metadatos Servicios de anotación El portal web de acceso en madri+d Acceso a cada uno de los repositorios individuales participantes + repositorio independiente Asesoramiento sobre los procedimientos de “auto-archivo” Acceso a la interfaz de búsqueda común del proveedor de servicios Servicios de valor añadido Novedades sobre el desarrollo del proyecto Información sobre el movimiento OA a nivel mundial Actividades de difusión y formación: blog “open access” en madri+d Asesoramiento jurídico Foro de consultas Organización del trabajo Grupo de Gestión Grupo de trabajo – wiki Madroño (http://www.consorciomadrono.net/prebienv.ht m) Grupo de Actividad: consejo asesor Participantes asociados El camino por delante: Motivar al autor hacer que el auto-archivo sea lo más fácil y simple posible y que el “open access” sea “respetable” (sistemas alternativos de revisión por pares y sistemas alternativos de evaluación de los resultados de la investigación científica) estímulos económicos, profesionales, marco legal claro y seguro, mandato Motivar a la Institución: demostrar los beneficios a la Institución Motivar a los usuarios locales/externos : servicios de valor añadido Lograr apoyo político: alianzas y grupos de presión. Coordinar las estrategias a nivel nacional, sobre todo en lo relativo al desarrollo del nivel de servicios y federación de redes. Algunas tecnologías a observar En el contexto de la investigación científica, los investigadores piensan más en términos de líneas de investigación y en compartir y por supuesto trabajar con colegas que pueden pertenecer a diferentes instituciones nacionales o internacionales. Están proliferando nuevas herramientas de colaboración que ofrecen formas más informales de comunicación y de gestión de acceso a los contenidos: Blogs Wikis P2P Algunas cuestiones para el debate ¿Qué es un repositorio institucional? ¿En qué se va a convertir cuando se haga “mayor”? ¿Qué funciones debe cumplir? ¿Qué contenidos deben guardarse en un repositorio institucional? Sólo el 15% de la investigación anual del planeta está disponible en acceso abierto: es esto significativo para decir que son una alternativa a la publicación científica tradicional? Pueden llegar a ser los repositorios institucionales una rémora para el “open access” (podemos esperar al “mandato”?) ¿Auto-archivar es “publicar”: son los repositorios institucionales capaces de ofrecer una vía “respetable” de publicación científica? Nuestra visión de futuro Una red nacional distribuida de repositorios abiertos (institucionales, independientes, disciplinarios) Un portal nacional de acceso abierto a la ciencia en España: evaluación/revisión/índice de citas/... Integración de la ciencia española en las redes globales del conocimiento del 15% al 100% “La disponibilidad universal del conocimiento humano que ha sido aprobado por la comunidad científica y académica” ¡MUCHAS GRACIAS! Alicia López Medina Biblioteca UNED [email protected]