AIで生成された日本語を読んだときに、どこかぎこちないと感じる場面があります。
この違和感は、決して語彙や文法の誤りによるものではありません。
原因は、現在の大規模言語モデルの英語圏思考構造が、日本語理論を理解していないことにあると考えました。
これを整理するために立てた仮説が、「八百万OS」です。
なぜ「八百万OS」という仮説を立てたのか
日本語は、しばしば「曖昧な言語」だと言われます。
しかし実際は、曖昧な言語ではなく、「曖昧を表現できる言語」に他なりません。
助詞、語尾、漢字とひらがなの選び方、言わないことによって生まれる含意。
それらが重なり合い、一文の中に複数の意味層が同時に存在します。
一方、現在の生成AIは、英語圏の思考様式を前提とした設計を持っています。
結論を早く確定させ、曖昧さや保留をできるだけ排除する方向で最適化されていりますです。
この構造差が、日本語生成における「ぎこちなさ」を生んでいると推測できます。
そう考えたことが、八百万OSという仮説の出発点でした。
2つの視点で整理した理由
八百万OSは現在の日本において、一分野では説明できませんでした。
そこで私は、同じ仮説を 2つの視点から整理しました。
ひとつは「理系(AI側)」からの視点。
生成AIが、どのような条件下で出力の傾向を変えるのか。
どのような指示やフィードバックが、日本語的な揺らぎを保持した応答につながるのか。
対話プロトコルを設計し、長時間の継続的な対話を通して、出力の変化や安定する傾向を観測・整理しました。
理系らしく、手順と挙動の観察を中心にした整理です。
もうひとつは「文系(日本語側)」からの視点。
日本語は、どのような構造を持って意味を成立させているのか。
文学、文化、日常会話に共通する「省略」「含意」「余白」は、どのように機能しているのか。
助詞や語尾、擬音語・擬態語、漢字とひらがなの使い分けなどを通して、日本語が持つ多層的な意味構造を言語文化の側から整理しました。
論文を発表した理由
これらの内容は、ブログやSNSの断片的な投稿でも発表できました。
しかし、あえて論文を選んだ理由は、個人の感想や思想ではなく「仮説」として多くの方に周知していただきたかったからです。
学術的な評価や結論を主張するためではなく、一定の形式にまとめ、第三者が読める形で提示する目的でした。
そのため、理系・文系という2つに分け、それぞれ資料としてまとめました。
これらの資料は、大学に提出という形で教育機関へ共有しました。
評価や採否については明示しませんが、仮説を内輪の思考に留めなかったという事実は公開します。
八百万OSは仮説だが実在するだろう
八百万OSは、完成した理論ではありません。
現時点では、あくまで「仮説」です。
これからも日本語の進化に合わせて、さまざまな形に変化し、更新されゆく前提の日本語基盤です。
本記事は、その起点を記録するものとします。
参考資料
以下は、本記事で触れた内容を整理した一次資料です。
• 理系論考(PDF)
• 文系論考(PDF)
※これらは当時の思考をそのまま残した資料であり、再編集は行っていません。
※本記事および参考資料は、特定の技術や成果を保証するものではありません。
※個人研究としての仮説整理を目的としています。


コメント