516 Shares 2597 views

código ASCII (Código estándar americano para el intercambio de información) – la codificación de texto básico para el alfabeto latino

Según la Unión Internacional de Telecomunicaciones, en el año 2016 por Internet con más o menos regularidad utilizar tres mil millones y medio de personas. La mayoría de ellos ni siquiera pensar en que cualquier mensaje enviado a ellos a través de un PC o dispositivos móviles, así como los textos que aparecen en los monitores de todo tipo, de hecho, es una combinación de 0 y 1. Esto se conoce como la representación codificada de la información. Se proporciona y facilita la aplicación de su almacenamiento, procesamiento y transmisión. En 1963, el código ASCII de Estados Unidos ha sido desarrollado, que es el objeto de este artículo.

Presentación de la información en el ordenador

En términos de cualquier texto computadora electrónica es un conjunto de caracteres individuales. Entre ellos no son sólo la letra, incluida la capital, sino también los signos de puntuación, números. Además, los símbolos especiales se utilizan "=", "y", "(" y espacios.

Una pluralidad de símbolos que componen el texto, llamado el alfabeto, y el número – de potencia (denotado como N). Para determinar la expresión N = 2 ^ b, donde b – número de bits de información o un peso símbolo particular.

Se demostró que el poder de 256 caracteres del alfabeto le permite enviar todos los caracteres necesarios.

Desde 256 es un 8 grado dos, entonces el peso de cada carácter es de 8 bits.

Unidad de medida de 8 bits se denomina de 1 byte, por eso decimos que el código binario de cualquier carácter en el texto que se almacena en el ordenador, ocupa un byte de memoria.

¿Cómo es la codificación

Cualquier texto introducido en la memoria del PC a través de las teclas del teclado, los números de los cuales fueron escritos, letras, signos de puntuación y otros símbolos. En la memoria que se transmiten en código binario, es decir, cada símbolo se asigna al código decimal familiar para una persona de 0 a 255, lo que corresponde a un código binario – .. De 00000000 a 11111111.

carácter Byte de codificación permite que el procesador realiza el procesamiento de texto, se refiere a cada carácter por separado. Al mismo tiempo, los 256 caracteres es suficiente para representar cualquier información de carácter.

Codificación de caracteres ASCII

Esta abreviatura significa el código estándar Inglés Americano para el intercambio de información.

Incluso en los albores de la informática, se hizo evidente que es posible llegar a una variedad de modos de codificación de la información. Sin embargo, para transferir información de un ordenador a otro se requiere para desarrollar un estándar único. Así, en 1963 hubo una tabla ASCII en los EE.UU.. Es cualquier equipo alfabeto carácter se le asigna un número de orden en la representación binaria. Inicialmente, el código ASCII se utiliza sólo en los Estados Unidos, y más tarde se convirtió en un estándar internacional para el PC.

Tabla de Contenidos

códigos ASCII se dividen en 2 partes. norma internacional se considera que es sólo la primera mitad de la tabla. Incluye código del número de secuencia de 0 (codificado como 00000000) a 127 (código 01111111).

número de serie

N

Codificación de texto ASCII

símbolo

0 – 31

0000 0000 – 0001 1111

Los personajes con N desde 0 a 31 se les llama gerentes. Su función es la de "guía" el proceso de salida de texto a un monitor o dispositivo de impresión, un pitido, etc.

32-127

0010 0000 – 0111 1111

Símbolos con N desde 32 127 (una parte estándar de la tabla) – las letras mayúsculas y minúsculas del alfabeto latino, los números 10-Nye, signos de puntuación y diversos soportes, comerciales y otros personajes .. Símbolo 32 indica un espacio.

128-255

1000 0000 – 1111 1111

Símbolos con N desde 128 a 255 (una parte alternativa de la tabla de la página o código) pueden tener una variedad de opciones, cada una de las cuales tiene su propio número. La página de códigos utilizada para establecer los alfabetos nacionales, que son diferentes del latín. En particular, se llevó a cabo con la ayuda del código ASCII de los caracteres rusos.

Tabla de codificación de mayúsculas y letras minúsculas están siguiendo uno al otro en orden y números alfabético – valores ascendentes. Este principio es válido para el alfabeto ruso.

los caracteres de control

tabla de codificación ASCII fue originalmente diseñado para la recepción y transmisión de información sobre esto ya no es utilizado por el dispositivo como un teletipo. En este sentido, el juego de caracteres no imprimibles incluido utilizado como comandos para controlar el dispositivo. Tales órdenes se utilizaron en tales técnicas de mensajería pre-computadora como código Morse, y así sucesivamente.

El símbolo "teletipo" más común es la NUL (00 "cero"). Todavía se utiliza en la mayoría de los lenguajes de programación, lo que indica el signo del final de la línea.

Cuando se usa la codificación ASCII

Código Estándar Americano requiere no sólo el teclado de introducción de texto. También se utiliza en el gráfico. En particular, las imágenes del programa Fabricante de ASCII Art representan diferentes espectros extensiones de caracteres ASCII codificación.

Estos productos vienen en dos tipos: editores gráficos que realiza la función de convertir una imagen en texto y convierte la "Imágenes" en los gráficos ASCII. Por ejemplo, se conoce es un buen ejemplo Smiley Codificación símbolo.

ASCII se puede utilizar al crear el documento HTML. En este caso, se puede introducir un conjunto de caracteres y un símbolo que corresponde a este código aparecerá cuando se ve la página en la pantalla.

Se necesita ASCII para crear sitios multilingües, como signos que no pertenecen a una mesa nacional en particular, sustituidos por códigos ASCII.

algunas características

Para codificar la información de texto en formato ASCII se utilizó originalmente 7 bits (uno permaneció vacío), pero en la actualidad se desempeña como 8 bits.

Las letras, que se encuentran en las columnas están por encima y por debajo, difieren entre sí solamente por un único bit. Esto reduce en gran medida la complejidad de la prueba.

aplicación ASCII en Microsoft Office

Si es necesario, este tipo de información de codificación de texto se puede utilizar en los editores de texto de Microsoft, como el Bloc de notas y Office Word. Sin embargo, al escribir en este caso, no podrá utilizar algunas funciones. Por ejemplo, usted no será capaz de llevar a cabo audaz como el carácter ASCII sólo conserva el significado de la información, haciendo caso omiso de su forma global y la forma.

estandarización

La organización adoptó ISO ISO estándar 8859. Este grupo define la codificación de ocho bits para diferentes grupos lingüísticos. En particular, la norma ISO 8859-1 – es el ASCII extendido, que es una tabla de los Estados Unidos y Europa Occidental. Un ISO 8859-5 – es la tabla que se utiliza para el alfabeto cirílico, incluyendo el idioma ruso.

Por razones históricas a la norma ISO 8859-5 se utiliza durante un corto tiempo.

Para la lengua rusa en el momento de codificación en realidad utilizado:

  • CP866 (página de códigos 866), o DOS, que a menudo se llama codificación alternativa GOST. Fue utilizado de forma activa hasta mediados de los 90-s del siglo pasado. Por el momento, casi nunca se utiliza.
  • KOI-8. Codificación se desarrolló en el 1970-80s, y por el momento se trata de una norma común para los mensajes de correo electrónico en RuNet. Es ampliamente utilizado en la familia del sistema operativo Unix, incluyendo Linux. "Ruso" versión de KOI-8, llamado KOI-8E. Además, existen versiones para otros idiomas cirílicos, como Ucrania.
  • Página de códigos 1251 (CP 1251, Windows – 1251). Desarrollado por Microsoft para proporcionar soporte para el idioma ruso en el entorno Windows.

La principal ventaja de CP866 primer estándar era preservar caracteres pseudo-gráfico en las mismas posiciones que en el ASCII extendido. Esto le permite ejecutar texto sin modificaciones del programa, la producción extranjera, como el famoso comandante Norton. En este punto CP866 se utiliza para programas diseñados para Windows, que operan en vista de texto en pantalla completa o en cajas de texto, incluso en FAR Manager.

los textos escritos en la computadora CP866 codificación, últimamente son bastante raros, pero se usa para nombres de archivo en ruso "Vindous".

"Unicode"

Por el momento, la más extendida es esta codificación. Códigos "Unicode" en el campo. El primero (de 0000 a U + U + 007F) incluye un conjunto de caracteres ASCII con códigos. Seguido de los caracteres de campo de diferentes literatura nacional, así como puntuacion y símbolos técnicos. Además, parte del código "Unicode" se reserva en caso de la necesidad de incluir nuevos personajes en el futuro.

Ahora se sabe que en ASCII de cada carácter se representa como una combinación de 8 ceros y unos. Laico, esta información puede parecer innecesario y poco interesante, pero no le gustaría saber lo que está pasando "en el cerebro" del equipo?!