はてブでの話。でもほかでも変わらないとおもう。
- 大雑把な分類としてのタグをつける ("声優", "anime", "life", ...)
- ツールや目測で「使われている」タグをチェックする
- 使われているタグのエントリごとの関連タグを抽出し、増えそうなタグを追加していく
はてブ拡張を使っているので、ブクマするときに上位のタグしか出てこないし、細やかなタグ付けの習慣がなければおのずと (ブクマするときに) 使うタグは限られてくるので、タグ付けに悩むことも少なくなる。
あと移植性。はてブはタグをブラケット ("[", "]") で囲むのでそれがデリミタといえるとおもう。
Delicious だとスペース区切り。あるいはカンマ使うシステムもあるかもしれない。
はてブに限らずブログだとかのホスティングサービスを変更することになったときタグもエクスポートされるだろうけど、デリミタではまることがないとも言い切れなさそうなので、注意を払っておく。デリミタに限った話じゃないけど。
気をつけたほうがよさそうなこと。
- [a-zA-Z0-9]+
- case-insensitive
- スペース
- タブ
- カンマ
- (パイプ)
最近のサービスは UTF-8 で統一されているところが多いっぽいけど、得てして海外のサービスは日本語をはじめとしたマルチバイトの扱いがてきとうだったりするので使わないにこしたことはない。
単語間の区切りはハイフンなりアンダースコアなりで。
守れていないところも多いけど、少なくともこれを守っておけばトラブルは少なそう。