ことばと意味の「構成性」について
はじめに
12月のマルレクは、ことばと意味の関係を「構成性」という観点から取り上げたいと思います。
「構成性」、あまり聞きなれない言葉かもしれません。英語だと、"compositionality" と言います。あるものが、もっと基本的なものから「構成」されていることを言います。
例えば、1 + 2 = 3 という式があったとします。この時、この式は、"1", "2", "3"という数字と、"+", "=" という記号から「構成」されていると考えることができます。
コンピュータのプログラムでも同じです。x = x + 1 という代入文は、変数を表す "x" と、数字を表す "1" と、"+", "=" という記号から「構成」されたものです。どんな長いプログラムも、それが、構成されたものであることは変わりありません。
こうした「構成性」は、いろんなところで見ることができます。ことばも、そうした「構成性」を持っています。
例えば、「黒い猫が走る」ということばは、「黒い」という形容詞、「猫」という名詞、「が」という助詞、「走る」という動詞から構成されています。
ここまでで挙げた「構成」の例は、それぞれ違う「構成ルール」に基づくものですが、少し乱暴ですが、それらの「構成ルール」を、「数式の文法」、「プログラムの文法」、「ことばの文法」というように、「文法」と呼ぶことができます。
(別の言い方もあります。こうしたレベルの記号や語からの「構成ルール」を「統語規則」とか「syntax」ということがあります。)
それでは、「意味」にも、「構成性」があるのでしょうか?
ことばを例に考えれば、ことばは意味を運ぶものです。その意味では、ことばと意味との関係は、直接的で、ことばと意味を分けるのは、少し難しいかもしれません。
ただ、「黒い猫」の意味は、「黒い」という語の意味と「猫」という語の意味から「構成」されると考えることは自然なことのように思えます。「(黒い猫)(が)(走る)」という文の意味も、(黒い猫)と(走る)の意味から「構成」されると考えるのは可能です。
意味の「構成性」を考える時難しいのは、構成された「意味」は、もはやもとの記号や語の並びそのものとは違うものだと言うことはわかっているのですが、それを、うまく表現することが難しいことかもしれません。
先にも述べたように、語のレベルで言うと特にそうなのですが、語そのものと語の意味は、強く結びついていて、分離するのは少し面倒です。でも、語から構成された文になると、文そのものとその意味は、分離しやすくなります。
記号や語の構成ルールに従った構成、文法的なレベルでの構成物は、そのうえ、コンテキストに応じて様々な「自然な意味」を持ちます。
プログラムでの、x = x + 1 という代入文は、「x という変数に x + 1 という値を代入する」という意味を持つと考えるのが自然です。また、1 + 2 = 3 と言う数式の意味は、「 「1 + 2 = 3」は正しい計算である」と考えることができます。
ただ、これらの例でも、「意味」の「解釈」は、最初の直接的対象であった、「文法的構成」のそれぞれの要素あるいはその全体を、「意味」の構成に取り込んでいるように見えます。それぞれの例でも、意味の「構成性」は、透けて見えています。
これらの、いくつかの「意味」の「解釈」を、一つの枠組みで捉えることができるでしょうか?
ことばと意味の「構成性」について
( pdf blog:「ことばと意味の「構成性」について」)
講演資料 「ことばと意味の「構成性」について」
講演ビデオ
第一部 意味の理論入門
第二部 ことばの構成性 ー 文法 ー
第三部 意味の構成性 ー カテゴリー論的分散意味論 ー
セミナーにむけたblog
- ことばと意味の「構成性」について
- 分数の割り算をお子さんにどう教えますか?
- 君は「ゲーデルの完全性定理」を知っているか?
- ローヴェールが考えたこと
- ごめんなさい、チョムスキー様
- 長い時間の後に
- ランベックのカテゴリー文法
- Lambek vs. Lambek
- chatGPTにケチをつけたいわけではないこと
- 数学的説明を少しスキップしました
- Coeckeが考えたこと
- 数式と図式
- 図で計算する
第一部 意味の理論入門
「ルール」の世界と「たとえ」の世界
( pdf blog:「分数の割り算をお子さんにどう教えますか?」)
「理論」と「モデル」
( pdf blog:「君は「ゲーデルの完全性定理」を知っているか?」)
Functorial Semantics
( pdf blog:「ローヴェールが考えたこと」)
第二部 ことばの構成性 -- 文法 --
Minimalist Program
( pdf blog:「ごめんなさい、チョムスキー様 」)
ChomskyとLambek
Combinatory Categorial Grammar
( pdf blog:「ランベックのカテゴリー文法」)
Pregroup Grammar
( pdf "Pregroup Grammar" blog:「Lambek vs. Lambek」)
第三部 意味の構成性 -- カテゴリー論的分散意味論 --
カテゴリー論的構成的分散意味論 Overview
( pdf blog:「chatGPTにケチをつけたいわけではないこと」)
DisCoCat入門 2
( pdf blog:「数学的説明を少しスキップしました」)
DisCoCat --Coecke’s original form
( pdf blog:「Coeckeが考えたこと」)
Interlude --Monoidal categoryとString Diagram
DisCoCat --Coecke’s diagrammatic calculus
参考資料:二つの分散意味論
DisCoCat の分散意味論
- Mathematical Foundations for a Compositional Distributional Model of Meaning
Bob Coecke, Sadrzadeh, Stephen Clark, 2010/05/23
https://arxiv.org/abs/1003.4394 - A quantum teleportation inspired algorithm produces sentence meaning from word meaning and grammatical structure
Stephen Clark, Bob Coecke, Edward Grefenstette, Stephen Pulman, Mehrnoosh Sadrzadeh, 2013/10/11 https://arxiv.org/abs/1305.0556 - Meaning updating of density matrices
Authors:Bob Coecke, Konstantinos Meichanetzidis, 2020/01/03
https://arxiv.org/pdf/2001.00862.pdf - Foundations for Near-Term Quantum Natural Language Processing
Authors:Bob Coecke, Giovanni de Felice, Konstantinos Meichanetzidis, Alexis Toumi, 2020/12/07
https://arxiv.org/abs/2005.04147
Deep Learningの分散意味論: BERT,GPT3を準備したもの
- Linguistic Regularities in Continuous Space Word Representations
Tomas Mikolov et al.
2013 (Word2Vec 論文)
https://aclanthology.org/N13-1090.pdf - Sequence to Sequence Learning with Neural Networks
Ilya Sutskever et al,
2014/12/14 (Sentence2Sentence論文 )
https://arxiv.org/pdf/1409.3215.pdf - Neural machine translation by jointly learning to align and translate
Bahdanau, D., Cho, K., and Bengio, Y,
2016/05/19 (Attention 論文)
https://arxiv.org/pdf/1409.3215.pdf