Formatos de ficheros
Xulio Fern‡ndez Hermida
Curso 2005/2006

Openformats.org
La informaci—n de esta presentaci—n fue obtenida de openformats.org (GNU)
 The goal of openformats.org is to create a freely-available and comprehensive documentation on open formats.
Copyright © 2004 openformats.org Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.

QuŽ es un formato
Un formato es lo que permite a una aplicaci—n interpretar los datos crudos en un archivo.
marcados en la extensi—n del nombre del archivo
formatos espec’ficos para im‡genes (como JPEG, PNG, GIF, TIF, BMP)
texto formateado (HTML, RTF, DOC)
documentos listos para la impresora (PDF, PS)

Formatos Abiertos
 Para trabajar con un archivo, la mayoria de las veces necesitaras alguna aplicaci—n que te permita leer, editar y guardar los datos contenidos en este archivo
abierto si el modo de representaci—n de sus datos es transparente y/o su especificaci—n es disponible pœblicamente.
ordinariamente, est‡ndares determinados por autoridades pœblicas
promovidos por compa–ias que eligen hacer pœblica la especificaci—n de los formatos usados por sus productos
puede ser codificado en una forma transparente (le’ble en cualquier editor de texto: este es el caso de lenguajes marcados) o en forma binaria

Formatos Propietarios
la forma de presentaci—n de sus datos es opaca y su especificaci—n no est‡ disponible pœblicamente
solo el software producido por una compa–’a que es due–a de las especificaciones de un formato de archivo podr‡ ser capaz de leer correcta y completamente la informaci—n contenida en este archivo
Formatos semi-proprietarios y pr‡cticas predatorias predatory practices
adoptar al principio un formato abierto y despuŽs modificar progresivamente este formato con extensiones propietarias

C—mo afecta el uso de formatos
Uso local
En el uso personal es donde menos se nota el efecto de los formatos propietarios (pero se nota)
Uso con otros usuarios
Al intercambiar archivos en formato propietario asumes t‡cticamente que todos los receptores de tu archivo poseen el software necesario para abrirlo (con lo que los est‡s obligando)
Evoluci—n del software
una estrategia largamente adoptada por productores de software consiste en actualizar regularmente los formatos de datos que implementan en sus aplicaciones

C—mo afecta el uso de formatos
Control sobre tu informaci—n
La informaci—n en ese archivo est‡ en manos del que te ha facilitado el software con el que lo creaste
Propagaci—n de virus
transportados por archivos infectados intercambiados por usuarios
Mantener monopolios en el Software
 Este problema puede no ser significativo para el usuario individual, pero afecta dram‡ticamente a la comunidad de usuarios
Tu informaci—n depende m‡s del creador del Software
Se convierte en est‡ndar de facto y frena la competencia

Cuatro razones para adoptar formatos abiertos
1 Garantizar accesibilidad y perpetuidad a tus datos: tu y los usuarios de tus datos siempre podran leer y accederlos.
2 Garantizar una completa transparencia al contenido de tus archivos.
3 Limitando la propagaci—n de virus: adoptando formatos abiertos ayuda a reducir drasticamente el riesgo de contaminaci—n.
4 Promoviendo diversidad interoperabilidad en el dominio de la comunicaci—n electr—nica.

Alternativas (texto)
DOC
HTML si necesita ser re-editado y/o publicado
RTF (Rich Text Format) como formato semi-propietario para texto con formato que cualquier procesador de textos lee
PDF (Portable Data Format) o PS (PostScript) si ya solo va a ser visto o impreso
TeX, DVI para textos cient’ficos
DVI (Device Independent format).- Un fichero fuente TeX o LaTeX tiene que ser compilado. El resultado de esta compilaci—n es el formato DVI, que puede leerse desde cualquiera plataforma.
el resultado de la compilaci—n ser‡, a su vez, convertido en PDF o PS

Alternativas (BDÕs y presentaciones)
XLS, XLW
CSV Comma Separated Values
PPT, PPS
PDF.
 no maneja animaci—n ni efectos de transici—n
pero posee capacidades interesantes de renderizaci—n:
¥  tanto las fuentes como los gr‡ficos son manejados como objetos vectoriales, los cuales permiten achicar/agrandar diapsitivas sin perdida de calidad.
¥  portabilidad: la paginaci—n y el formateo son idŽnticos en cualquier plataforma en que los estŽs viendo.

Alternativas (Imagen)
GIF
Para im‡genes en paleta de 256 colores
sustituible por su equivalente abierto, el PNG.
BMP, TIF (BitMap, Tagged Image File)
JPEG es el formato de elecci—n.
Tama–o ajustable en funci—n de la calidad,
B/N o Color
Formato de uso en la web
WMF (Windows Meta File)
 SVG(Scalable Vector Graphics) es su equivalente abierto para im‡genes vectoriales
formato basado en el est‡ndar pœblico (XML, CSS, HTML) y creado por el consorcio W3

Alternativas (Audio)
MP3 o WMA (Windows Media Audio)
OGG (Ogg Vorbis)
desarrollado para reemplazar todos los formatos propietarios usados actualmente para compresi—n de audio (MP3, WMA, etc.).
 -Ogg es el nombre del formato del contenido desarrollado por Xiph.org para audio, video y metadatos.
-Vorbis es el nombre del esquema de compresi—n de audio el cual eventualmente sera incluido en Ogg. Otros formatos pueden incluir Ogg, tales como FLAC y Speex
 Hay muchos programas y librer’as que usan los archivos de Ogg Vorbis en diferentes plataformas (Beos, Java Legacy MacOS, Linux, MacOS X, OS/2, Windows).

Alternativas (Audio)
MPC (Musepack)
formato de audio que da gran importancia a la calidad
 Est‡ basado en el algoritmo MPEG-1 Layer-2 / MP2
 Hay codificadores y decodificadores para Linux, Windows y Mac OS X.
FLAC (Free Losslesss Audio Codec)
 FLAC es un formato de compresi—n sin pŽrdida completamente libre y abierto.
Puede ser usado con su contenedor (container) nativo o con el contenedor de Ogg de la Fundaci—n Xiph.Org.
Actualmente es posible utilizarlo bajo Linux, Mac OS X y Windows;
adem‡s, est‡ presente en dos librer’as Java que permiten su utilizaci—n bajo cualquier plataforma en que pueda correr una M‡quina Virtual Java.

Alernativas (Audio)
Speex
Formato de compresi—n de audio abierto y libre de patente realizado expresamente para la voz.
El objetivo de este proyecto es romper la barrera de las aplicaciones vocales formando una alternativa libre a las costosas soluciones propietarias.
 Su utilizaci—n se encuentra en la VoIP (Voice over IP), en los Ôaudio booksÕ a travŽs de internet o en el archivado de datos (por ejemplo los email de voz).
 El proyecto ha entrado a formar parte de la Fundaci—n Xiph.org.

Diapositiva 15
Formatos
V’deo
MPEG, Quick Time, AVI, DIVx, SWF
Televisi—n
MPEG2

Acceso local. Acceso remoto
Audio en tiempo real
Reproductores: Real player, Windows Media Player
Formatos: ASF
Audio almacenado
Reproductores: iTunes,
Formatos: MPEG4, MP3