Google Book Searchをコーパスとして使う

コーパス (Corpus) とは、単純にいうと用例のデータベース。英英辞書では、コーパスに基づき、用例の多い順に語義を定義してあるものもある。

コーパスが用例のデータベースであるなら、Google(のWeb検索)をコーパスに使用するというのは自然な発想だが、ネイティブが書いたものではない英文も対象となるため、正確さを求めるには多少難がある。例えば、日本人にありがちな誤りだと、それなりの件数がヒットしてしまう(ただし、ヒット件数やドメインなどからある程度妥当性を類推することは可能)。

そこで、最近はGoogle Book Search(ブック検索)をコーパスとして愛用している。ブック検索なら、文法的な誤りはほとんど含まれないという意味で信頼性が高く、論理的に書かれたものが多いため前後からコンテキストを類推しやすい。

実際の利用例は、以下のリンクを参照。

関連リンク