jueves, 19 de mayo de 2011

Tipos de datos en MySQL

Vamos a ver los tipos de datos en MySQL.

MySQL soporta una gran variedad de datos, uno para cada necesidad.


Cadenas de caracteres

Los subtipos de datos existentes aquí son CHAR, VARCHAR, BLOB, TEXT, ENUM y SET.


CHAR y VARCHAR

Son muy similares, y quizás la diferencia más notable sea la forma de almacenamiento: cuando definimos una columna tipo CHAR de tamaño N, e ingresamos un valor (de menos de N caracteres) en esa columna, MySQL rellenará con espacios lo que sobra, mientras que si hacemos lo mismo con una columna de tipo VARCHAR, en este caso no se rellenará con espacios. Cuando obtenemos información a través de una consulta SQL, no obtenemos los espacios sobrantes: MySQL los remueve.

Si se ingresa una cadena de mayor cantidad de caracteres que el tamaño prefijado al definir la columna, la cadena se truncará al llegar al límite.
Por defecto, las comparaciones (en cualquiera de los dos tipos de datos) son insensibles a mayúsculas y minúsculas.

BLOB y TEXT

Se usan para cadenas con un rango que dependerá del tamaño que queramos almacenar.

La diferencia entre ambos es que TEXT permite comparar dentro de su contenido sin distinguir mayúsculas y minúsculas, y BLOB las distingue. Otra diferencia podría ser su uso. TEXT tiende a ser usado para cadenas de texto plano (sin formato), mientras que BLOB se usa para objetos binarios, o sea, cualquier tipo de datos o información, desde un archivo de texto con todo su formato, hasta imágenes, archivos de sonido o video.

BLOB (es un acrónimo de Binary Large OBject, objeto binario de gran tamaño) se subdivide en cuatro tipos que difieren sólo en la capacidad máxima de almacenamiento.

Con TEXT sucede lo mismo, e incluso, hay correspondencia entre la capacidad máxima de almacenamiento de unos y otros.

ENUM

Este tipo de string puede seleccionar su valor únicamente de una lista finita (máximo de 65.535 elementos) de opciones definidas por el usuario, y otras dos por defecto (índice 0 que significa error por ingresos fuera de rango, por ejemplo y está representado por "", e índice NULL con valor NULL).

Por ejemplo:

Definiendo columnas de tipo ENUM("argentina","mexico","paraguay"):

CREATE TABLE user (
nombre enum('juan','pedro') NOT NULL,
pais enum('argentina','paraguay', 'mexico')
);



SET

Similar a ENUM en su funcionamiento, sólo que aquí se puede seleccionar ninguno
o más de un valor de la lista (hasta 64, los muestran separados por comas).

Al ser ENUM semejante a una lista, podemos realizar consultas tales como:

SELECT * FROM nom_tabla WHERE set_col LIKE '%value%';
SELECT * FROM nom_tabla WHERE FIND_IN_SET('value',set_col)>0;
SELECT * FROM nom_tabla WHERE set_col = 'val1, val2';



Numéricos

Se definen los subtipos DECIMAL (o NUMERIC, o DEC), INTEGER (o INT), TINYINT, BIT, BOOL, MEDIUMINT, BIGINT, SMALLINT, FLOAT y DOUBLE (o DOUBLE PRECISION, o REAL).

Todos los tipos numéricos pueden definirse con dos parámetros opcionales: UNSIGNED (impide que los campos numéricos acepten signo negativo, es decir, sólo se aceptarán el cero y los valores positivos) y ZEROFILL (completa con ceros a la izquierda hasta la longitud máxima). La forma de uso es:

TIPO_DATO [UNSIGNED] [ZEROFILL]

Veamos las características de cada tipo de dato:

TINYINT[(M)]

M es el número de dígitos que serán visibles al mostrar el contenido del campo. Si
el campo que se va a mostrar sobrepasa los M dígitos, se mostrarán M dígitos.

  • Si se omite o se sobrepasa la capacidad de TINYINT, se toma la cantidad máxima soportada por este tipo de dato.
  • Si se define con signo va desde -128 a 127.
  • Sin signo (UNSIGNED) va desde 0 hasta 255.
BIT

Es un TINYINT de un dígito (TINYINT(1)).

BOOL

Es un TINYINT de un dígito (TINYINT(1)).


SMALLINT[(M)]

M es el número de dígitos que serán visibles al mostrar el contenido del campo. Si
el campo que se va a mostrar sobrepasa los M dígitos, se mostrarán M dígitos.

  • Si se omite o se sobrepasa la capacidad de SMALLINT, se toma la cantidad máxima soportada por este tipo de dato.
  • Si se define con signo va desde -32768 a 32767.
  • Sin signo (UNSIGNED) va desde 0 hasta 65535.


MEDIUMINT[(M)]

M es el número de dígitos que serán visibles al mostrar el contenido del campo. Si
el campo que se va a mostrar sobrepasa los M dígitos, se mostrarán M dígitos.


  • Si se omite o se sobrepasa la capacidad de MEDIUMINT, se toma la cantidad máxima soportada por este tipo de dato.
  • Si se define con signo va desde -8388608 a 8388607.
  • Sin signo (UNSIGNED) va desde 0 hasta 16777215.

INT[(M)]

M es el número de dígitos que serán visibles al mostrar el contenido del campo. Si
el campo que se va a mostrar sobrepasa los M dígitos, se mostrarán M dígitos.

  • Si se omite o se sobrepasa la capacidad correspondiente a INT, se toma la cantidad máxima soportada por este tipo de dato.
  • Si se define con signo va desde -2147483648 a 2147483647.
  • Sin signo (UNSIGNED) va desde 0 hasta 4294967295.

INTEGER[(M)]

Sinónimo de INT.


BIGINT[(M)]

M es el número de dígitos que serán visibles al mostrar el contenido del campo. Si
el campo que se va a mostrar sobrepasa los M dígitos, se mostrarán M dígitos.

  • Si se omite o se sobrepasa la capacidad correspondiente a BIGINT, se toma la
  • cantidad máxima soportada por este tipo de dato.
  • Si se define con signo va desde -9223372036854775808 a 9223372036854775807.
  • Sin signo (UNSIGNED) va desde 0 hasta 18446744073709551615.

Todas las funciones matemáticas trabajan internamente con valores BIGINT.

FLOAT[(M,D)]

Sirven para definir números con coma, con menos precisión que DOUBLE.
M es el número de dígitos que serán visibles al mostrar el contenido del campo. Si
el campo que se va a mostrar sobrepasa los M dígitos, se mostrarán M dígitos.

El rango de posibles valores va de -3.402823466E+38 a -1.175494351E-38 , 0, y desde 1.175494351E-38 hasta 3.402823466E+38.

DOUBLE[(M,D)]

Sirven para definir números con coma, con más precisión que FLOAT.

M es el número de dígitos que serán visibles al mostrar el contenido del campo. Si
el campo que se va a mostrar sobrepasa los M dígitos, se mostrarán M dígitos.

El rango de posibles valores va:
de -1.7976931348623157E+308 a -2.2250738585072014E-308, y de 2.2250738585072014E-308 a 1.7976931348623157E+308.

DOUBLE PRECISION[(M,D)]

Sinónimo de DOUBLE.

REAL[(M,D)]

Sinónimo de DOUBLE.

DECIMAL[(M[,D])]

Debemos saber que aquí el número es almacenado internamente como una cadena de caracteres (un carácter por cada dígito). Ni el separador decimal (,) ni el
signo menos (-) para números negativos son parte de M.

Si no se le da ningún argumento, por defecto M es igual a 10, tomando un rango de -9999999999 a 99999999999 para números con signo.

Y por defecto, D es igual a 0.

DEC[(M[,D])]

Sinónimo de DECIMAL.

NUMERIC[(M[,D])]

Sinónimo de DECIMAL.

Fecha y hora

Los subtipos de datos existentes son DATETIME, DATE, TIMESTAMP, TIME y YEAR.

DATETIME

DATETIME: Se utiliza cuando se necesita trabajar con fechas y horarios a la vez. El
formato por defecto es ' YYYY-MM-DD HH:MM:SS' pero se le puede dar uno diferente si por algún motivo necesitáramos hacerlo, por ejemplo: 'YYYY/MM/DD HH%MM%SS'.

El rango va desde:

'1000-01-01 00:00:00' hasta '9999-12-31 23:59:59'.

Si al momento de ingresar un DATETIME definimos un valor inválido (por ejemplo,
minuto superior a 60) se almacenará la fecha nula. Por ejemplo: para el formato
'YYYY-MM-DD HH:MM:SS' sería '0000-00-00 00:00:00'.

DATE

DATE se utiliza cuando se necesita trabajar sólo con fechas. El formato por defecto
es 'YYYY-MM-DD' pero se le puede dar un formato diferente si por algún motivo necesitáramos hacerlo, por ejemplo: 'YYYY*MM*DD'. Rango '1000-01-01' a '9999-12-31'.

Si al momento de ingresar un DATE definimos un valor inválido (por ejemplo, mes
superior a 12) se almacenará la fecha nula. Por ejemplo: para el formato 'YYYY-MM-DD' sería '0000-00-00'.

TIMESTAMP

Combinación de fecha y hora. El rango va desde el 01-enero-1970 al año 2037. El formato de almacenamiento depende del tamaño del campo y se visualiza como un número.

Si al momento de crear la tabla se define un TIMESTAMP mayor a 14, se redondea a 14; si se define un número impar, se redondea al par inmediatamente superior.

Si al momento de ingresar un TIMESTAMP definimos un valor inválido (por ejemplo, minuto superior a 60) se almacenará la fecha nula. Por ejemplo:

Para TIMESTAMP(2) sería 00.

Para TIMESTAMP(12) sería 000000000000.

Otro punto importante es que al ingresar una fecha o un horario se toman los datos no ingresados como ceros: esto supone un problema para las fechas, ya que si
tenemos un TIMESTAMP(2) no podemos ingresar sólo el año porque eso supondría
algo como 990000 (día y mes no pueden ser cero, estarían fuera de rango). En cambio, la hora, los minutos y los segundos sí pueden ser cero. Es decir que no podemos insertar cadenas de menos de 6 caracteres.

En PHP hay una gran cantidad de funciones que precisan trabajar con TIMESTAMP.

TIME

Debemos saber que TIME se utiliza cuando se necesita trabajar sólo con horarios. El formato por defecto es 'HH:MM:SS' (aunque también soporta 'HHH:MM:SS'
para períodos largos de tiempo), pero se le puede dar un formato diferente si por
algún motivo necesitáramos hacerlo, por ejemplo: 'HH*MM*SS'.

El rango va de '-838:59:59' a '838:59:59' (es importante que el hecho de poder almacenar TIME negativos nos da la pauta de que existen más usos que el de simplemente guardar el horario de un determinado suceso).

  • Si al momento de ingresar un TIME definimos un valor inválido (por ejemplo, minuto superior a 60) se almacenará la fecha nula. Por ejemplo: para el formato 'HH:MM:DD' sería '00:00:00'.
  • Si ingresamos valores fuera de rango, éstos se terminan reemplazando por el extremo más cercano.

YEAR

Se usa para representar años. Su formato es por defecto YYYY' (puede definirse como 'YY'). El rango va desde 1901 hasta 2155.

  • Si se representa el año con sólo dos dígitos, surge la siguiente particularidad: si se define el campo tipo YEAR como un número, no podemos representar el año 2000 con 00 (sería interpretado como el año 0000); debemos hacerlo con la cadena 00 o con 0.
  • Si ingresamos un valor ilegal, éste será convertido a 0000.