«前の日記(2011年06月23日) 最新 次の日記(2011年06月25日)» 編集

だめだめ日記

ツッコミの内容は検索サイトからの検索やサイトのレーティングに影響します。そのため問題があるキーワードを含むと思われるツッコミについては、当方の判断で削除することがあります。予めご了承ください。 なお、コメントspamと判断されたツッコミは自動的に消去されます。ご容赦ください。
2002|12|
2003|01|02|03|04|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|05|06|09|10|11|12|
2013|01|02|02|03|08|09|
2014|01|
2015|09|10|11|
2016|01|04|

執筆、翻訳などに関わった書籍類


【改訂新版】Samba [実践]入門

Linux教科書
LPICレベル3 300試験

マスタリング Nginx

実践 パケット解析 第2版

改訂版 Sambaのすべて

アンドキュメンテッド
Microsoftネットワーク

その他の書籍は だめだめ日記のおみせ@本店でどうぞ。



2011年06月24日 [長年日記]

[Samba]7年ぶりに再燃!? - Sambaの内部文字コード議論

ようやくというか……

2004年頃に、いろいろと言ったんですが受け入れてくれなかったSambaの内部文字コード固定に関する議論が、今度はSambaチーム側から出てきました。

まぁ、7年早く気づいてよと言いたい気分もありますが、なんにしても朗報です。

現在のSambaの内部文字コード(内部的に保持している各種ファイルに書き込まれる際の文字コード)は、unix charsetパラメータに依存するため可変です。

ですので、内部処理で様々な文字コードを想定しないといけないためバグの温床になりやすいほか、unix charset パラメータを運用途中で変更することが極めて困難です。

そのため、2004年頃に、

  • 内部文字コードを Unicode に固定すること
  • 文字列処理の都合を考えると、1文字を1〜4バイトで符号化するUTF-8より、2バイトもしくは4バイトで符号化するUTF-16の方が内部文字コード(符号化形式)としては適している

ということを、わたしも含めて何名かで、以下のスレッドなどで散々主張したんですが、当時は受け入れられませんでした。

まぁ、7年経って、先方の多言語処理に関する認識が、ようやく追いついてきたということですかね。

とはいえ、まだまだ予断を許さない状況ですので、是非応援をよろしくお願いします。

追記(06/27)

すらどでも Samba、内部文字コードを今度こそ固定化か ?として取り上げてくださったようで。

ということで、こっちも7年ぶりくらいに書き込んでみたです。ユーザがちゃんと残ってたのに、ちょっとびっくり。

本日のツッコミ(全1件) [ツッコミを入れる]
_ @ktoume (2011年06月27日 11:36)

7年も...ありがとうございます。そして応援しています。


Copyright (C) 2003-2017 TAKAHASHI, Motonobu
webmaster@monyo.com