国際電気通信連合(ITU)によると、いくつかの規則性を持つ2016年のインターネットは、3年半億人を楽しみました。それらのほとんどがさえ、すべての種類のモニターに表示されている任意のPCまたはモバイルガジェットを経由して、それらに送られたメッセージだけでなく、テキストは、実際には、情報の符号化された表現と呼ばれる0と1これの組み合わせであることについて考えていません。これは、その貯蔵、処理及び送信の実装を提供し、容易にします。 1963年に、米国のASCIIコードは、この記事の主題である、開発されました。
任意の電子計算の観点から機械テキストは個々の文字の集合です。それらには、大文字を含む文字だけでなく、句読点、数字も含まれます。さらに、特殊記号 "="、 "&"、 "("とスペースが使用されます。
テキストを構成する文字の集合、アルファベットと呼ばれ、その数はパワー(Nと表記)です。それを決定するには、式N = 2 ^ bを使用します。ここで、bは特定のシンボルのビット数または情報量です。
256文字のアルファベットで、必要なすべての記号を表すことができることが証明されています。
256は2の8乗であるため、各シンボルの重みは8ビットです。
8ビットの単位は1バイトと呼ばれるので、コンピュータに格納されているテキストの任意の文字のバイナリコードが1バイトのメモリを占有すると言うのが通例です。
すべてのテキストは、個人のメモリに入力されます。数字、文字、句読点及び他の記号が書かれたキーボードのキーを用いてコンピュータに接続される。 RAMでは、それらはバイナリコードで送信されます。つまり、各文字は、0〜255の慣習的な人間の十進数コードと一致します。これは00000000〜11111111のバイナリコードに対応します。
バイトバイト文字エンコードではテキストの処理を実行するプロセッサは、各シンボルに別々にアクセスする。同時に、任意の文字情報を表現するには256文字で十分です。
この略語は英語で、情報交換のためのアメリカの標準コードを表しています。
コンピュータ化の黎明期には、情報をエンコードするさまざまな方法を考え出すことができます。しかし、あるコンピュータから別のコンピュータに情報を転送するには、単一の標準を開発する必要がありました。だから、1963年に米国ではASCIIエンコーディングテーブルがありました。その中で、コンピュータアルファベットの任意の記号には、そのシリアル番号がバイナリ表現で割り当てられます。最初は、ASCIIコードは米国のみで使用され、後にPCのための国際標準となりました。
ASCIIコードは2つの部分に分かれています。国際標準はこの表の前半にすぎません。これには、0(00000000としてコード化された)から127(コード01111111)までの序数を持つシンボルが含まれます。
シーケンス番号 N | ASCIIテキストエンコーディング | シンボル |
0 - 31 | 0000 0000 - 0001 1111 | Nが0〜31のシンボルはマネージャーと呼ばれます。それらの機能は、テキストをモニタまたは印刷装置に出力するプロセスを案内し、オーディオ信号などを与えることである。 |
32 - 127 | 0010 0000 - 0111 1111 | Nが32〜127のシンボル(標準部分テーブル) - ラテンアルファベットの大文字、小文字、10桁、句読記号、各種括弧、商用記号など。記号32はスペースを示す。 |
128 - 255 | 1000 0000 - 1111 1111 | Nが128〜255のシンボル(代替パーツ表またはコード・ページ)は、それぞれが独自の番号を持つ異なるバリアントを持つことができます。コードページは、ラテン文字とは異なる国別アルファベットを指定するために使用されます。特に、ASCIIはロシア語の文字にエンコードされています。 |
エンコード表では、アルファベット順に大文字と小文字が続き、数字は昇順になっています。この原則はロシアのアルファベットのためにも保存されています。
ASCIIエンコーディングテーブルが最初に作成されましたテレタイプのように、長時間使用されていないデバイスに関する情報を受信して送信するためのものである。これに関して、この装置を制御するためのコマンドとして使用される非印刷物は、文字セットに含まれていた。モールス符号などのような事前計算機メッセージング方法においても同様のコマンドが使用された。
最も一般的な "テレタイプ"シンボルはNUL(00、 "ゼロ")です。これは、行末の文字を示すほとんどのプログラミング言語で引き続き使用されています。
アメリカの標準コードは、キーボードからテキスト情報を入力します。グラフィックスでも使用されています。特に、ASCII Art Makerプログラムでは、さまざまな拡張子の画像が一連のASCII文字記号を表しています。
同様の製品には2種類あります。 画像をテキストに変換し、「図面」をASCIIグラフィックスに変換することによって、グラフィックエディタの機能を実行します。例えば、よく知られたスマイリーは、符号化記号の鮮明な例である。
ASCIIは、HTML文書を作成するときにも使用できます。この場合、特定の文字セットを入力することができ、ページを表示すると、このコードに対応するシンボルが画面に表示されます。
特定の全国表の一部ではない文字はASCIIコードに置き換えられるため、多言語サイトの作成にはASCIIも必要です。
ASCIIテキスト情報を符号化するためには、元々7ビット(1が空に残った)を使用したが、今日、彼女は8ビットとして動作します。
上下の欄に位置する文字は、1つのビットだけによって互いに異なる。これにより、検証の複雑さが大幅に軽減されます。
必要であれば、このタイプのテキストエンコーディングメモ帳やOffice WordなどのMicrosoftのテキストエディタで情報を使用できます。ただし、入力すると、この場合は一部の機能を使用することができなくなります。たとえば、太字で選択することはできません。ASCIIエンコーディングは情報の意味だけを保持し、一般的な外観や形式は無視するためです。
ISOはISO 8859規格を採用しています。 このグループは、異なる言語グループの8ビットエンコーディングを定義します。特に、ISO 8859-1は拡張ASCIIであり、米国および西ヨーロッパ諸国の表です。 ISO 8859-5は、ロシア語を含む、キリル文字に使用されるテーブルです。
歴史的な理由から、ISO 8859-5規格はあまり長く使われていませんでした。
現時点でロシア語の場合、エンコーディングは実際に使用されます。
最初の標準CP866の主な利点拡張ASCIIと同じ位置に擬似グラフィック記号を保存していました。これは有名なノートン司令官として、プログラムの変わらないテキスト、外国の生産を、実行することができます。この時点で、CP866は、FARマネージャーを含め、フルスクリーンテキストビューまたはテキストボックスで動作Windows用に設計されたプログラムのために使用されています。
CP866エンコーディングで書かれたコンピュータテキストは、まれであるが、 "Vindous"のロシア語ファイル名に使用されている。
現時点では、最も普及しているこの特定のエンコードを受け取りました。 Unicodeコードは領域に分割されています。最初の(U + 0000からU + 007Fまで)には、コード付きASCIIセットの文字が含まれています。次に、さまざまな国別スクリプトの兆候、句読点や技術的シンボルに従ってください。さらに、Unicodeコードの一部は、将来新しいシンボルを含める必要がある場合に備えて予約されています。
ASCIIエンコーディングでは、それぞれシンボルは8個の0と1の組み合わせとして表されます。専門家以外の人にとっては、この情報は不要で面白くないように見えるかもしれませんが、PCの "脳"で何が起こっているのか知りたいのですか?
</ p>