Sobre el grupo de datos
¿Cómo comienzo a diseñar una base de datos?
Primero, examine qué información tiene o planea tener. Si ya tiene el grupo de datos, ya sea en formato electrónico o en papel, revea los datos que incluye. Haga una lista de los campos (es decir, los títulos de la columna en su tabla de datos). Luego paselos por el Esquema de OBIS. Si hay uno o más campos en el Esquema de OBIS que cubren la información que desea mantener, entonces use ese nombre del campo y el formato sugerido. Si hay uno o más campos en el Esquema de OBIS que no aplican a sus datos, simplemente omítalos. Si hay información adicional que usted quiere mantener en su base de datos que no este cubierta por el Esquema de OBIS, entonces puede agregar campos adicionales.
¿Necesito usar una base de datos relacionada?
Una base de datos relacionada es una clase de software que permite mantener los datos en tablas vinculadas. No necesita usar una base de datos relacionada, su información puede mantenerse, por ejemplo, en una hoja de cálculo de Excel. Sin embargo, una base de datos relacionada ofrece grandes ventajas. Primero, permite acceder a la información más eficazmente. Por ejemplo, puede ingresar un nombre científico una sola vez en una tabla de nombres. Entonces para cada registro u observación de esta especie, no necesitará tipear el nombre de nuevo, simplemente puede escogerlo de una lista desplegable. Así es más rápido y no tiene que preocuparse por el tipeo o por escribir correctamente el nombre. Además, a las bases de datos relacionadas se puede hacer preguntas más complejas que a una hoja de cálculo. Por ejemplo, usted puede pedir "todos los registros de la especies X que se tomaron al norte de los 30°N, a 300m, y entre los años 1980 y 1985."
Una observación acerca de los archivos de texto. Los archivos de texto delimitados son buenos para archivar datos (salvándolo de tal manera que en algunos años se tendrá acceso a ellos), pero no son muy buenos si quiere trabajar con el grupo de datos, ya sea extraer, actualizar o sacar ciertos datos de interés.
¿Si uso una base de datos relacionada, cuál debo usar?
Varios productos están disponibles, y muchos son similares y tienen funcionalidad similar, o sea que no es una decisión crítica. Microsoft Access es el más común de los paquetes comerciales de software. El Microsoft SQL Server, Oracle, Sybase y PostgresSQL son las bases de datos industriales más comunes. Esto significa que estas se diseñan para ser eficaces con grandes volúmenes de datos. Generalmente, si cuenta con un grupo de datos con cientos de miles de archivos, entonces deberá considerar una de las bases de datos industriales, o una de las varias soluciones gratuitas disponibles. Si tiene decenas de miles de archivos o menos, entonces el Microsoft Access estará bien. El problema es que los paquetes industriales tienden a ser más costosos y muy poco amigables. PostgreSQL y MySQL son gratuitos y los paquetes de bases de datos relacionados "open-source" son bastante buenos. Puede encontrar más información sobre MySQL en http://www.mysql.com y sobre PostgreSQL en http://www.postgresql.org/ (las compañías pueden vender paquetes que incluyen documentación extra, etc., pero el software central es gratuito). PostgreSQL es más poderoso que MySQL; sobre todo, sus características geográficas lo cual hace que muchas personas lo prefieren. Pero el poder conlleva a mayor complejidad. Cualquiera que escoja, debe asegurarse que sea compatible ODBC - esto significa que puede comunicarse con otras fuentes (para exportar, sacar datos, etc.). La mayoría de los paquetes de bases de datos relacionadas son compatibles ODBC.
¿Qué hardware y software necesito para servir los datos a través de la web?
Si quiere publicar datos directamente a OBIS, necesitará una computadora con un sistema operativo que tenga la base de datos, software del servidor, y DiGIR instalado. Si desea preparar su propia página web, también tendrá que programar para crear la página y las funciones de búsqueda a las cuales accederán los usuarios. HTML es el lenguaje en que se construyen las páginas web; además pueden usarse varios idiomas como Perl/CGI, PHP, Pitón, o Java para crear los formularios de búsqueda para que los usuarios puedan entrar los datos, y éstos necesitarán incluir los SQL u otros comandos que investigan su base de datos. El software como Dreamweaver ayuda a programar las páginas web con mayor facilidad. Para aquéllos que cuenten con un presupuesto, hay algunas buenas opciones gratuitas. Linux es un sistema operativo gratuito, el Apache es un servidor, y MySQL y PostgreSQL (vea arriba) son bases de datos relacionadas gratuitas.