2004-05-01から1ヶ月間の記事一覧

不覚

う〜む。UTF-16って固定長じゃないんだね。 全然知らなかった。 というわけで当然↑の方に示したURLのコードは間違っていたわけです。 でもまぁ日本語しか使えない私には問題ないのかも。 って言うか、UTF16が4バイトになる場合なんて、 やってみても私には正…

Squeakで文字コード判別

ちょっと修正したバージョンを置いてみる。 http://www.geocities.jp/io_oj/Multilingual-TextDetection.zip yahooは拡張子csは許されないっぽいし、 yahoo以外のrefererは弾かれるっぽい。非常に不便。 portlandというところを1年くらい利用していたりもす…

Squeakで文字コード判別

折角文字コードを判別しても、その文字コードのコンバーターが無い。。。 というわけでとりあえずFTF-16(LEとBE)のコンバーターを作ってみた。 一応ちゃんと変換出来ているようだ。 まぁ実質は変換なんてしていないわけだから、 実は態々コンバーターを作ら…

Squeakで文字コード判別

とかを作ってみるといいかも、と●宮さんが言うので、 簡単なものを作ってみました。 流石にデータを完全にスキャンしてしまっているだけあって、遅い! 本当は固定長バッファーで処理出来るC++のやつがあったはずだったんだけど、 なんかどこに行ったのか分…