¿Qué es el texto ASCII y cómo se usa?

ASCII es un acrónimo que quizás haya escuchado en relación con el texto de computadora, pero es un término que está perdiendo rápidamente su uso gracias a un recién llegado más poderoso. Pero, ¿qué es ASCII y para qué se utiliza?

¿Qué significa ASCII?

Quizás el lugar más fácil para comenzar es el acrónimo en sí, así que ampliémoslo:

A merican S tandard C oda para I nformaciones I nterchange

Este bocado de una frase realmente no da una imagen completa, pero algunas partes ofrecen inmediatamente algunas pistas, en particular las dos primeras palabras. ASCII es una norma estadounidense, cuya importancia pronto se hará evidente.

El “Código para el intercambio de información” sugiere que estamos hablando de un formato para pasar datos de un lado a otro. Específicamente, ASCII trata con datos textuales: caracteres que componen palabras en un lenguaje típicamente legible por humanos.

ASCII resuelve el problema de cómo asignar valores a letras y otros caracteres para que, cuando se almacenen como unos y ceros en un archivo, puedan volver a traducirse a letras cuando el archivo se lea más tarde. Si diferentes sistemas informáticos están de acuerdo en usar el mismo código, dicha información se puede intercambiar de manera confiable.

Relacionado: Cómo encontrar símbolos y buscar sus significados

La historia de ASCII

A veces denominado US-ASCII, ASCII fue una innovación estadounidense desarrollada en la década de 1960. El estándar ha sufrido muchas revisiones desde, principalmente en 1977 y 1986, cuando ASCII se actualizó por última vez.

Las extensiones y variaciones se han basado en ASCII a lo largo de los años, principalmente para atender el hecho de que ASCII omite muchos caracteres utilizados, o incluso requeridos, por idiomas distintos del inglés de EE. UU. ASCII ni siquiera tiene en cuenta el símbolo de la moneda del Reino Unido ("£"), aunque la libra está presente en Latin-1, una extensión de 8 bits desarrollada en la década de 1980, que también codifica varias otras monedas.

ASCII se extendió enormemente y fue reemplazado por Unicode, un estándar mucho más completo y ambicioso, que se analiza a continuación. En 2008, Unicode superó a ASCII en popularidad para el uso en línea.

¿Qué caracteres representa ASCII?

Para una computadora, la letra "A" es tan desconocida como el color púrpura o el sentimiento de celos. Las computadoras manejan unos y ceros, y depende de los humanos decidir cómo usar esos unos y ceros para representar números, palabras, imágenes y cualquier otra cosa.

Puede pensar en ASCII como el código Morse del mundo digital, el primer intento, de todos modos. Mientras que el código Morse se usa para representar solo 36 caracteres diferentes (26 letras y 10 dígitos), ASCII fue diseñado para representar hasta 128 caracteres diferentes en 7 bits de datos.

ASCII distingue entre mayúsculas y minúsculas, lo que significa que representa 52 letras mayúsculas y minúsculas del alfabeto inglés. Junto con los mismos 10 dígitos, eso es aproximadamente la mitad del espacio utilizado.

Los símbolos de puntuación, matemáticos y tipográficos ocupan el resto, y una colección de caracteres de control, que son códigos especiales no imprimibles con significados funcionales; consulte a continuación para obtener más información.

A continuación, se muestran algunos caracteres típicos que codifica ASCII:

Binario Decimal Personaje
010 0001 33 !
011 0000 48 0
011 1001 57 9
011 1011 59 ;
100 0001 sesenta y cinco UNA
100 0010 66 segundo
101 1010 90 Z
101 1011 91 [
110 0001 97 una
110 0010 98 segundo
111 1101 125 }

Tenga en cuenta que los valores elegidos tienen algunas propiedades útiles, en particular:

  • Las letras del mismo caso siempre se pueden ordenar numéricamente ya que están en orden. Por ejemplo, A tiene un valor menor que B, que tiene un valor menor que Z.
  • Las letras de diferentes casos se compensan exactamente con 32. Esto hace que sea muy fácil traducir entre mayúsculas y minúsculas, ya que solo se debe cambiar un bit para cada letra, de cualquier manera.

Personajes de control

Además de las letras, la puntuación y los dígitos, ASCII puede representar una serie de caracteres de control, puntos de código especial que no producen una salida de un solo carácter, sino que proporcionan significados alternativos sobre los datos a lo que sea que los esté consumiendo.

Por ejemplo, ASCII 000 1001 es el carácter de tabulación horizontal. Representa el espacio que obtendrá cuando presione la tecla TAB. Por lo general, no verá estos personajes directamente, pero a menudo se mostrará su efecto. Aquí hay algunos ejemplos más:

Binario Decimal Personaje
000 1001 9 Ficha horizontal
000 1010 10 Linea de alimentación
001 0111 23 Fin del bloque de transmisión

¿Qué pasa con otros personajes?

ASCII tuvo un gran éxito durante los primeros días de la informática, ya que era simple y ampliamente adoptado. Sin embargo, en un mundo con una perspectiva más internacional, un sistema de escritura simplemente no es suficiente. Las comunicaciones modernas deben ser posibles en francés, japonés, de hecho, en cualquier idioma en el que queramos almacenar texto.

El conjunto de caracteres Unicode puede abordar un total de 1,112,064 caracteres diferentes, aunque solo alrededor de una décima parte de ellos están actualmente definidos. Eso puede parecer mucho, pero la codificación tiene como objetivo no solo atender a decenas de miles de caracteres chinos, sino que también cubre emoji (casi mil quinientos) e incluso sistemas de escritura extintos como Jurchen.

Relacionado: Los 100 emojis más populares explicados

Unicode reconoció el dominio de ASCII en su elección de los primeros 128 caracteres: son exactamente iguales que ASCII. Esto permite que los archivos codificados en ASCII se utilicen en situaciones en las que se espera Unicode, proporcionando compatibilidad con versiones anteriores.

Resumen

El texto ASCII representa las 26 letras del alfabeto inglés, con dígitos, puntuación y algunos otros símbolos. Cumplió muy bien su propósito durante la mayor parte de medio siglo.

Ahora ha sido reemplazado por Unicode, que admite una gran cantidad de idiomas y otros símbolos, incluidos los emoji. UTF-8 es, para todos los propósitos prácticos, la codificación que debe usarse para representar caracteres Unicode en línea.