いろいろ紹介

いろんなジャンルで書いていきます

文字コードとは

2018-06-18 14:10:29 | EXCEL用便利ツール
Excel用の無料の便利ツールの紹介
紹介するツールは、エクセルのお供:アテンダントです。
アテンダントは、現場から生まれたエクセルのブックの処理を便利にするツール群で、無料のフリーソフトです。必要にせまられたいろんな処理から使用頻度の高いもが選択されています。

無料ダウンロードURL
http://www.ozsystem.jp/frdatn/atn_top.htm

窓の杜様でのレビュー一覧


簡単に機能が分かるように見本のデータが付属していますので、見本データをセットボタンですぐに機能を確認する事ができます。


補足:アテンダントはマクロではありません。Excelのセキュリティ設定でマクロ無効にしていても動作しますので安心してお使いになれます。
文字コードとは

文字コードとはコンピュータ上で文字を表現する場合に、各文字に割り当てられる番号(コード)の事です。
一番簡単な ASCIIコードでは
a は 97
b は 98
となっています。

ASCIIコードは基本的には0~127までの番号ですが、日本ではカナを扱う必要性から、この2倍の0~255までの番号(1バイト)で表しています。

初期のコンピュータでは、数字・アルファベット・カナだけで十分でしたが、
やがて漢字を扱う事が求められ、256では足らなくなり、256のさらに256倍(つまり2バイト)で番号を割り振り65536文字を表せるようになりました。

日本ではシフトJISとして制定されています。
やがて各国の文字を扱う必要性からそれでも足りなくなり、各種の文字コードが出現してきます。

代表的なものには、EUC/UTF-8/UNICODE(UTF-16)/シフトJIS等があります。
シフトJIS
日本語用の文字コードとしてJIS規格で定められたJISコードを改良したもので2バイトで表現されます。
日本語Windowsではこれがよく使われるので、シフトJISの場合は文字化けを起こすことはありません。

UNICODE
全世界共通で使えるように、世界中の文字を収録する文字コードの規格です。
この中で、どのように符号化するかを取り決めた文字符号化方式として
よく使われるものにUTF-8・UTF-16があります。
UTF-8は、データの中に圧倒的に多い数字やアルファベットを1バイトで表せるよう工夫されていて1~4バイトで表現されます。
単にUNICODEと言った場合はUTF-16を指す場合がほとんどで、1文字は2バイト又は4バイトで表現されます。

EUC
UNIX系で標準的に使われる文字コードの規格の一つです。
日本語の文字を入れたのものをEUC-JPと呼び、日本ではほとんどの場合EUCはこれを指します。

BOM:バイトオーダーマーク (Byte Order Mark)
文字コードの区別がつくように、UNICODEでは、テキストの先頭につける数バイトのデータを付けています。
例えば、UTF-8の場合は 0xEF 0xBB 0xBF の3バイトとなっています。
しかしながら過去との互換性の為、このBOMがないUTF-8も多数出回っています。


文字化け
文字化けを起こす場合は、処理しているプログラムが各種文字コードに対応していない場合に発生します。
日本語Windowsではこれがよく使われるので、シフトJIS以外の場合に発生する事があります。


アテンダントのCSV処理では、上記各文字コードに対応しています。

3万円からのExcel開発(アテンダントベース自動化)
アテンダントの各機能をベースに、御社固有の処理を開発します。1から開発する場合に比較して、低価格で提供させていただきます。
価格:1処理3~5万円(税別)

http://www.business-directory.jp/ozhanbai/service1/