グーグルの特許を読む

最近仕事で特許の執筆作業行っている。何故かわからないが、特許の明細書作成作業がすごーく嫌いだ。なぜだろう。頭を結構使った割には、最終的なアウトプットがワード文章と図面だけだからかな。アウトプットが動作するプログラムだったらまた面白いんだろうけど。

で、なかなか作業がはかどらないので暇つぶしに特許庁ホームページの特許電子図書館をいろいろ眺めていた。するとグーグルが出願している特許が結構あったので、今日は早起きして、いくつかの明細書を読んでみた。

特表2006-512641 電子メッセージの表示および応答方法および装置

GMailのスレッド表示機能に関する特許。メールを受信したらその署名とヘッダ情報をみて、返信元のメールと本文を比較して、繰り返しテキストを検知して、その部分の表示を省略したり、代わりになんらかの記号（送信者名など）を表示する、という特許。特定のユーザとメールをやり取りするときなどに便利なあの機能ですね。その他の特許についてもそうだけど、たとえば「どうやって繰り返しテキストを検知するか」といった詳細なアルゴリズムについては言及されていない。大まかな処理の流れと、その一実施形態の概要についてのみ説明している感じ。「どの程度の粒度で明細を書くべきか」というところがなかなか参考になりますね。ちなみに誤字脱字がちょっとあった。

特表2007-534057 情報を取り込み抽出する方法およびシステム

Googleデスクトップ検索における、アーティクルのインデックス化のタイミングについての特許。普通はバッチ処理でアーティクルをインデックス化するがその間はマシンのパフォーマンスが低下し、さらにバッチ処理は周期的にのみ行われるので、ユーザが検索したタイミングでは最新のアーティクルが検索結果にでてこない可能性がある、という問題に対する解決策に関する話。多分新規性があるのは、たとえばワード文書だったらワードのアプリケーションのイベントをフックして、たとえば新しい文字が追加されたとか、文字列が削除された、っていうイベントを検知して、インデクシングのためのキューにリアルタイムに送る、という箇所。すべてのイベントに対して反応するのではなく、たとえば「文字列を選択した」とか「マウスを移動した」というイベントはほとんど検索対象として価値を持たないので、そこは無視する、みたいな判断をする。さらに、インデックス化の処理は、プロセッサの負荷、アイドルタイム、ディスクアクセス、使用可能なメモリ容量等を監視して、負荷が低いときに行うらしい。

特表2008-520037 表意文字と表音文字とを要する言語のための自動補完方法およびシステム

グーグルツールバーの検索ボックスのサジェスチョン機能についての特許。検索クエリの一部分をサーバーに送信して、それをクエリ補完テーブルと照合して、予測された完成した文字列の組みを返して、クライアントの画面上に表示する、というもの。このテーブルのレコードは「部分的なクエリ、完全なクエリ、その被検索頻度」という３つのカラムから成る。こういう具体的なテーブル構造などをみることができるってのは勉強になるな。また、ある文字列をハッシュしたもの（これがフィンガープリント）と、それに後続する文字列（サフィクス）と、その組み合わせについての得点、を保持したフィンガープリントマップテーブルというものもあるみたい。部分クエリをプレフィックスとサフィックスに分割して、このテーブルに問い合わせる事によって予測を行うみたい。また、日本語についても考慮されていて、たとえば「鮭日本」という検索クエリに対しては、「鮭」「日本」だけではなく「さけ」「しゃけ」「にほん」「にっぽん」というキーワードでクエリ補完テーブルを見に行ってくれるという感じ。

その他

あとは
・グーグルマップのローカル検索で、地理情報とWebページをマッピングして検索できるようにする方法
・Webページから信頼できる地理情報を抽出する方法
などを軽く読みました。ところで発明者に日本人の名前があまり見当たらないですが、これから公開されたりするのかな。

特許明細の読み進め方

僕の場合はだいたい、
1.発明の名称と[要約]を読む
2.[特許請求の範囲]、[請求項]は一切読まないw
3.図面を見る（なんとなくわかる）
4.[従来の技術]をよむ。いまから解決しようとしている問題が何なのかわかる。
5.[発明の詳細な説明]を読む（結構読みやすい）

まあ、普通ですねw ちなみに特許を検索するときは特許電子図書館のページの「特許・実用新案検索」で探した方がよい。PDFでダウンロードもできる。初心者向け検索は簡単だけどブラウザ上で読むしかないのでつらい(PDFダウンロードできない)。図面の解像度も低いしね。

特許電子図書館
 http://www.ipdl.inpit.go.jp/homepg.ipdl

どれも完全に理解して読むのは難しいですが、システムがどういう仕組みで動いているかとか、どのへんに新規性、特許性があるのかとか、グーグルが何について権利を主張したがっているのか、とかいろいろわかってお勉強になりました。

つぎはアップルが出願している特許について読んでみます。