Saltar al contenido principal

Codificación de caracteres

Cuando utilizamos un ordenador, vemos textos, números, imágenes o símbolos, pero en realidad todo se almacena y transmite como secuencias de ceros y unos. Para que esos datos binarios puedan interpretarse correctamente, es necesario un sistema que establezca una correspondencia entre los números y los caracteres que usamos. A ese sistema se le llama codificación de caracteres.

¿Por qué es relevante la codificación?

Sin una codificación estándar, cada ordenador o programa podría interpretar los mismos números de manera diferente, generando textos ilegibles o símbolos extraños. La codificación es, por tanto, el “lenguaje común” que permite que la información escrita sea entendida y compartida sin errores en distintos sistemas, aplicaciones y países.

ASCII

Uno de los primeros sistemas fue ASCII (American Standard Code for Information Interchange), creado en los años 60. Representa letras del alfabeto inglés, dígitos, signos de puntuación y algunos caracteres de control (como el salto de línea). Cada carácter se guarda en 7 bits, lo que permite representar 128 símbolos distintos. Fue suficiente en los inicios, pero pronto se quedó corto para otros idiomas y alfabetos.

UTF-8

Para resolver esas limitaciones, surgieron codificaciones más amplias basadas en el estándar Unicode, que busca incluir todos los caracteres de todos los idiomas del mundo. La más utilizada es UTF-8 (Unicode Transformation Format – 8 bits).

  • En UTF-8, cada carácter puede ocupar entre 1 y 4 bytes, dependiendo de su complejidad.
  • Es compatible con ASCII: los primeros 128 caracteres son idénticos, lo que facilita la compatibilidad con sistemas antiguos.
  • Permite representar millones de símbolos, incluyendo letras acentuadas, alfabetos no latinos, emojis y símbolos técnicos.

La codificación es la clave invisible que hace posible que podamos leer y escribir en ordenadores sin importar el idioma o el dispositivo. ASCII sentó las bases, pero hoy en día UTF-8 se ha convertido en el estándar universal que garantiza que la comunicación digital sea realmente global.