「単語ベクトル」とは何か?

  Рет қаралды 112,301

ことラボ

ことラボ

Күн бұрын

📕参考文献
・本家 Word2Vec
code.google.co...
・python ライブラリ Gensim
radimrehurek.c...
・訓練済み日本語単語ベクトル
aial.shiroyagi...
🐧 Twitter
/ kotolaboryo
🎵Music: www.bensound.c...
🙏 Special Thanks
日本語字幕・汉语字幕:あやかりさん

Пікірлер: 156
@Mejiro_kyoso
@Mejiro_kyoso 2 жыл бұрын
掃除機の「飼う:1」どう考えてもルンバで草
@stsz1403
@stsz1403 2 жыл бұрын
ルンバの登場で掃除機の単語ベクトルがペット方向にも伸びつつある =ペットに使われるような文脈に掃除機という単語が用いられるようになってきた 未知の環境に進出して進化の途上にある生物のようで面白い
@えび-v1p
@えび-v1p 8 ай бұрын
4:43 これw
@ybk1940
@ybk1940 2 жыл бұрын
東京-日本+イギリス=ロンドンなのなんとなく理解できるしすごいなこの概念
@ギョーザ爆弾
@ギョーザ爆弾 2 жыл бұрын
移項すると東京-日本=ロンドン-イギリスで首都-国が成り立つからすごいよな。
@underambii8388
@underambii8388 2 жыл бұрын
@@ギョーザ爆弾 やべぇめちゃくちゃすげぇwwww
@鳥獣GIGA
@鳥獣GIGA 2 жыл бұрын
@@underambii8388 当然の帰結
@pihha5204
@pihha5204 2 жыл бұрын
東京は日本の首都だった…?
@イッヌ-m6y
@イッヌ-m6y 2 жыл бұрын
@@pihha5204 江戸時代の住民現る
@hirominakami9991
@hirominakami9991 2 жыл бұрын
さすが猫吸い 吸引がちゃんと入ってるの凄い笑 色々見させてもらってるけど、改めて言語面白いなと思いました
@ギョーザ爆弾
@ギョーザ爆弾 2 жыл бұрын
掃除機に飼うが1あるのはルンバの影響だろうか
@しめい-l4m
@しめい-l4m 2 жыл бұрын
@@ギョーザ爆弾 砂浜でルンバ散歩させてそう
@やまた-h3k
@やまた-h3k 2 жыл бұрын
毎回、最後にスッキリさせてから考えさせられることを言ってるのが好き。 「ほらほら、何見てばかりいるんだ?君も考えるんだよ?!」 って言われてる気がしていつも、はっ!ってなる
@-haru885
@-haru885 2 жыл бұрын
コサイン類似度で内積計算出てきて知ってる知識が使えてなんか良かった
@____ai6121
@____ai6121 2 жыл бұрын
学んできたことがこんなところで、、、!と思うと、勉強しておいてよかったなあって思いますよね。
@タケノコ-n4n
@タケノコ-n4n 3 жыл бұрын
猫に吸引が12あるの良いw
@GO-ts1nu
@GO-ts1nu 2 жыл бұрын
これか kzbin.info/www/bejne/m3m5oWambd-NiNk
@taiyip9238
@taiyip9238 2 жыл бұрын
@@GO-ts1nu スパムかと思ったけど有能で草
@ギョーザ爆弾
@ギョーザ爆弾 2 жыл бұрын
てか普通に猫吸うもんな
@ももみかん-s3t
@ももみかん-s3t 2 жыл бұрын
でも、猫を吸う人いる。間違いではない
@osentak
@osentak 2 жыл бұрын
犬に吸引がないのはおかしい
@対艦巨砲大好きな人
@対艦巨砲大好きな人 2 жыл бұрын
何に使うんやこんなもん、と思ったらそうか… なるほど、そうやってネットって検索者の要望に答えてたのか… すげーな…プログラマーの方々には頭が上がらないな…
@m.e.7382
@m.e.7382 2 жыл бұрын
最近では文脈を考慮できるBERTが用いられることが多いですね。"I ate an apple."と"I have a apple product"のappleをフルーツと会社のappleとして区別できます。
@35satori
@35satori 2 жыл бұрын
文系も理系も仲良く発狂できる動画見つけたw
@109ドル
@109ドル 2 жыл бұрын
美術系も数字強い方が便利だなって何度も思いました 多分言語とかも統計とか地学にぶち当たって泡吹いてるんだろうなぁ
@ss-jx5tf
@ss-jx5tf 2 жыл бұрын
理系はわかるんじゃね?これ 俺はわからんけど
@ふゆ-y1q
@ふゆ-y1q 2 жыл бұрын
実際にプログラム組むのは別ですが、文系でも大学で金融、心理学、社会学、マーケティングとかで、統計の基礎としてやるかなぁと思います。
@inntaisagi
@inntaisagi Жыл бұрын
言い方が草
@Natttttto
@Natttttto 2 жыл бұрын
この人の動画なに見ても外れないんだよなぁ
@kk-xn9rm
@kk-xn9rm 2 жыл бұрын
国語でも数学でもなくてガチガチの情報系の内容だった!!
@登録者100万人目指す米
@登録者100万人目指す米 2 жыл бұрын
猫吸いは猫好き、 掃除機飼うはルンバの影響が出てて草。
@mdmy-srrc
@mdmy-srrc 3 жыл бұрын
以前これを研究していた方をお見かけしたことがあります。物事の性質を数学的に考えるのは楽しいですね。
@fontono
@fontono 2 жыл бұрын
Googleが生まれたての頃、開発者がテレビのインタビューに答えていたのを思い出す。 インタビューア 「あなたは何をしているのですか?」 Google開発者  「我々はコンピュータに『常識』を覚えさせているのです。ものすごくたくさん」
@iwa6981
@iwa6981 2 жыл бұрын
NETFLIX でAIの偏見についての動画をちょっとだけ見てたので、それをよりプログラム的にわかりやすく解説してくれてありがとう
@ranten-oukoku
@ranten-oukoku 3 ай бұрын
あれ?ゆるコンピュータ科学ラジオでの水野氏のモノマネより遥かに声高いぞ
@sudou07
@sudou07 2 жыл бұрын
ただのとんでも研究かと思ったら、実用的な技術だった・・・。
@toofoo7382
@toofoo7382 2 жыл бұрын
自然言語処理の分野では一般的な手法やね 導入が分かりにくい考え方だから、この動画は良い教材になるなぁ
@skys6015
@skys6015 2 жыл бұрын
4:40 「猫吸い」の文化を知る者にとってはニヤリとする調査結果。 さて、今回の動画のテーマを元に、SNS由来のビッグデータによって新しい検索アルゴリズムの技術革新が起きれば、現在のseo過対策問題や検索キーワードの選択が苦手な人の問題への解決策が得られそうですね。とてもわくわくしたテーマでした。
@agemakimakimaki
@agemakimakimaki 2 жыл бұрын
このこと知った時、ベクトル好きになったなあ
@cecilehonda2234
@cecilehonda2234 2 жыл бұрын
これで社会科学についても研究できるから本当に素晴らしいですね
@そふぃ-n4d
@そふぃ-n4d 2 жыл бұрын
今日のQuizKnockさんの動画見て戻ってきました! QuizKnockさんの方ではこれを使った式でクイズしてたのですが、こちらではどうやってベクトルを判定しているのか何故そんなことができるのかを理論的に説明されていてどちらも面白いです☺
@user-ly9el2kb5u
@user-ly9el2kb5u 2 жыл бұрын
私は外大卒の日本語教師という超文系なんですが、理系目線の言語学面白いですね!
@うめ子-n7i
@うめ子-n7i 2 жыл бұрын
自然言語処理は計算機科学ではメジャーな分野です!
@hirozoo3974
@hirozoo3974 2 жыл бұрын
へぇ〜面白い言葉遊びだなぁ〜と思っていたら検索に利用されているですげぇー!!!ってなった
@みかづきも-g8q
@みかづきも-g8q 2 жыл бұрын
1人掃除機を飼ってるやつが居るな
@seasidelabel
@seasidelabel 2 жыл бұрын
つまり単語ベクトルとは要素に分解するということですね。 東京(地名、首都、日本)-日本(国)+イギリス(国)=?(地名、首都、イギリス) こうすると分かりやすいかな? 言い換えれば、要素の似ている単語は入れ替えても文章がおかしくない、ということになりますね(「犬を飼っている」→「猫を飼っている」、「バス通勤」→「電車通学」の様に)
@tase9979
@tase9979 2 жыл бұрын
言語のベクトルについては知らない分野で面白かったです。 ところで、日本語のデータ収集では文法的に英語よりやりにくいところがあるのかなと感じました。 例えば動画にあった「猫-吸う」は「目的語-動詞」で、「掃除機-吸う」は「主語-動詞」(「掃除機で」なら手段ですが)の関係です。「猫を吸う」ので猫は吸われる側であり、掃除機は「掃除機が(ゴミなどを)吸う」ように吸う立場が一般的かと。そうなると、名詞の後の「が」「を」「で」といった助詞を考慮しないといけないのかなと思います。 また、英語は語順が重要(ここは詳しくないのですが間違ってたらすみません)で語の前後の関係でデータの傾向がでそうですが、日本語は語順を入れ換えることができることも多い(例「掃除機が猫を吸う」→「猫を掃除機が吸う」※猫を掃除機で吸ってはいけない)ので、そういったことも気を付けないといけないのかなと思いました。
@yuya9623
@yuya9623 Жыл бұрын
単語ベクトルの生成方法が体感的にとても良くわかりました!!ありがとうございます!!
@ninomiya-27
@ninomiya-27 2 жыл бұрын
6:50 最初は言ってることに納得してたけど、数学的に考えると「性別の関係ない職業A」から「性別の関係ない職業B」になるのは仕方ない気がしてきた。
@三竹山-m2r
@三竹山-m2r 3 жыл бұрын
おもしろいチャンネルを見つけてしまった 応援します
@植松京子
@植松京子 2 жыл бұрын
2:53アインシュタイン➖物理学➕哲学=ニーチェ
@マイケル-b1z
@マイケル-b1z 2 жыл бұрын
鳥肌たった
@yotta11
@yotta11 2 жыл бұрын
単語空間の空間としての構造に興味が出てくる 例えば犬と猫が張る空間はどのようなものかとか線形独立な動物50個の線型結合で哲学用語を表したら係数はどうなるかとか
@fukyouwa-yin
@fukyouwa-yin 2 жыл бұрын
後半想像したら草
@Mrdango-sq6lh
@Mrdango-sq6lh 2 жыл бұрын
単語空間の基底が動物園になってるのは流石に草
@ああ-o6y6b
@ああ-o6y6b 2 жыл бұрын
来年、言語解析の授業取ろうかな
@Ryon_P329
@Ryon_P329 2 жыл бұрын
このベクトルも時代に合わせてアップデートしていけばかなり有能
@KANIME
@KANIME 2 жыл бұрын
よろしければ、他の動画にも日本語の字幕付けてください。日本語学習者にとって、より簡単になりますよ。ありがとうございます!
@ZipRas497
@ZipRas497 2 жыл бұрын
λさんのやつでも見たけどすごいねこれ
@soryay
@soryay 2 жыл бұрын
猫・掃除機の伏線が吸引で回収されるのすごいww
@momonso0821
@momonso0821 2 жыл бұрын
これは最近見た動画の中で一番ほえーーってなった 類似した検索結果とかSiriに聞いた時とかの答えとかが,多少表記ゆれあっても理解してくれるのなんでかなーっていつも疑問だったわ
@sk-15
@sk-15 2 жыл бұрын
ものすごくおもしろい。
@johnlennon2009nyc
@johnlennon2009nyc 2 жыл бұрын
分かりやすくて助かりました
@reito-udon
@reito-udon 2 жыл бұрын
言語の機械学習ってどうやってたのか知らんかった。ベクトルにしてと特徴量取り出してたんかな
@みゃーもと-l8e
@みゃーもと-l8e 2 жыл бұрын
悪いデータを集めて暴走の流れ こち亀だなぁてひとり笑いました。
@HayakitaP
@HayakitaP 2 жыл бұрын
この言葉の関係性が最も遠いと考える10単語を入力すると語彙力が測れるってサイトがありましてね…(英語限定ですが)
@アクアジェットで吹っ飛ばしてけ
@アクアジェットで吹っ飛ばしてけ 4 ай бұрын
いちいち登場してくれるの助かる
@全てをぶっ潰す
@全てをぶっ潰す 2 жыл бұрын
喋り方好きすぎる
@mimizu8706
@mimizu8706 2 жыл бұрын
画像も言語と同じベクトルに変換できると画像検索や画像生成(単語から画像)とか画像の分類や状況説明(画像から単語)もできるよね
@クリーブランド-e5l
@クリーブランド-e5l 2 жыл бұрын
transformerを音声に適用すると今ひとつって現象が起こるのはきちんと合成しないと違和感の塊の音声と違って 文字ベクトルは出力がちょっと正しい値からズレてても決まった単語に寄せてくれるからうまくいくだけなんだな
@大豆大好き剥き太郎
@大豆大好き剥き太郎 2 жыл бұрын
Microsoftのツイートbotが問題発言をしたのは繕うという作業が抜けていたからだと思うね
@cocoh4873
@cocoh4873 2 жыл бұрын
昨日のクイズノックで鶴崎さんがこれ使ってましたね
@やんほぬ-r1m
@やんほぬ-r1m Жыл бұрын
機械は嘘をつかないってことですね
@ISSAN-02
@ISSAN-02 2 жыл бұрын
分布仮説の説明の例文のところで一瞬でも空白に「メタルギア」と入れれば良いのかと思ってしまったワイは恐らく末期
@p0ny0s95
@p0ny0s95 2 жыл бұрын
数字50個で定義されるベクトルって事は、50次元世界での矢印…ってコト!?
@calvalefirea2926
@calvalefirea2926 2 жыл бұрын
なんの前置きもなくさも常識かのようにPython、しかも対話版使っててびっくりした いやgensim使うならpythonなので問題ないんだけども Colabとか使うのかなぁと思ってたのでびっくり あと思ったよりしっかり説明してて勉強になる
@grandmascurtain
@grandmascurtain 2 жыл бұрын
猫吸ってる人いるし掃除機飼ってる人いるもんな〜
@toshihirom2038
@toshihirom2038 2 жыл бұрын
ドラえもんー猫はコロスケでしょうよ
@Tomohiko_JPN_1868
@Tomohiko_JPN_1868 2 жыл бұрын
単語ベクトルってSFやオカルトっぽい言葉で格好いいですね。 単語という1元の1変数を2元の1変数に変換して 操作出来る形にするっていうのは 数学でいう実数空間からベクトル解析や複素平面へ拡げたような感じですね。 追記:    (プログラマ) - (男性) = (専業主婦) これ、失礼な言い方だけど意味を考えれば割と良い線行ってます。 多くの薄給プログラマは雑用エンジニアみたいな作業が大半ですし あれを女性に置き換えて例えるとすれば家事手伝いの作業って比喩としては冴えてます。
@なつめぐ-n1w
@なつめぐ-n1w 2 жыл бұрын
動画内の説明だと2次元グラフだけど、実際には一つの単語を説明するには15次元になるの面白いな
@山内太郎-m9w
@山内太郎-m9w 2 жыл бұрын
単語ベクトルは「一つの単語に一つの意味」を前提とする研究で、複数の意味を持つ単語やその文法表現に対しては課題が多い ちょっと触れてほしかった
@ajimov
@ajimov 2 жыл бұрын
学習元の人間が「AIは差別的だ!」と叩くの皮肉でいいよね
@おむ-t5s
@おむ-t5s 2 жыл бұрын
8月-夏休み気になる
@Natsu-hi7ee
@Natsu-hi7ee 2 жыл бұрын
犬の時に吸引が出てきて笑ってしまった
@anubisu1024
@anubisu1024 2 жыл бұрын
猫のテキストデータのうち1割弱が猫吸いしてて草
@TK-vr1ob
@TK-vr1ob 2 жыл бұрын
単語全部が線型空間に存在してる場合、言語の論理に近似するんじゃないかていうのはあまりにも勝手すぎるし、上手くいかない理由はその仮定にあるのは明らかだから、実際にそれなりの精度を持ったアルゴリズム開発した人間はどういう精神力の持ち主なんだて思う
@遊輔堂薫風
@遊輔堂薫風 2 жыл бұрын
意味は単語自体に内在はしていないので、周りの語との関係から意味を定量化する、という仕組みですね。←雑なまとめ
@しんぴのしずく
@しんぴのしずく 2 жыл бұрын
これで「ゲスの極み乙女。」とか「ポムポムプリン」とかの対義語作ったらどうなるか知りたい
@aaaaa-kq1dh
@aaaaa-kq1dh 2 жыл бұрын
AIも人間の偏見や悪い言葉を学習するのか…善悪はともかくそれだけ精巧ということだな
@葛葉恨之介-z1x
@葛葉恨之介-z1x 2 жыл бұрын
おもしろい むかし論理学という本で理論の計算式というのを見たことがあるのですが それを数値化できるとは
@そらぞめ
@そらぞめ 3 ай бұрын
???「古典的な単語ベクトルはお煎餅に似ている」
@TG-xx4rp
@TG-xx4rp 2 жыл бұрын
単語の言語ベクトルに対してその動作、例えば(successに対してsucceed)みたいな本質的には意味が同じではあるが品詞が異なる関係についてはコサイン類似度がかなり高くなりそうなんだけど言語テンソルなるものを導入すれば解決できる??
@yasshi05
@yasshi05 2 жыл бұрын
理系なのでタイトルが「単位ベクトル」に見えたwww
@toyosohakmorik9838
@toyosohakmorik9838 2 жыл бұрын
多次元ベクトルも可能ですか?
@ian-df6dc
@ian-df6dc 2 жыл бұрын
猫について数字が50個って言ってたしそもそもこれが50次元ベクトルなのでは
@3kan-7e5
@3kan-7e5 2 жыл бұрын
何やこの文系の皮を被った理系は……
@凜月-m7e
@凜月-m7e 2 жыл бұрын
ベクトル化は分類問題でお世話になりました
@ss-jx5tf
@ss-jx5tf 2 жыл бұрын
偏見っつーか事実だわな 割合として多いから仕方ないっちゃ仕方ない
@showflatkk.3288
@showflatkk.3288 2 жыл бұрын
その点、りんなは日本らしくオタク化していったよな
@gerektreqretnowar7783
@gerektreqretnowar7783 2 жыл бұрын
内積使いそうと思ったら使ってた
@みかさ-d8d
@みかさ-d8d 2 жыл бұрын
犬吸引しますよ!(愛犬家
@hajimeshachou
@hajimeshachou 2 жыл бұрын
線形代数の授業でやったなーなつい
@yuraaaraa
@yuraaaraa 2 жыл бұрын
ラムダ技術部さんのも結構面白いですよ ※ステマじゃないです
@ReyZone00れいぞーん
@ReyZone00れいぞーん 2 жыл бұрын
!?大学の自然言語のプロジェクトでやったことだ!
@時雨ユキ
@時雨ユキ 2 жыл бұрын
単語が近い遠いってどうやって定義すんだろ
@sunsuga8524
@sunsuga8524 2 жыл бұрын
近い遠いは色々あるぜ! 数値で、距離尺度化しちまえば、クラスタ分析もできるしMDS分析もできるぜ!
@김완기-f5e
@김완기-f5e 2 жыл бұрын
good video :)
@nihey7853
@nihey7853 2 жыл бұрын
ある単語の周囲に出てくる単語の類似度で判定かーおもろいな
@龍女導師
@龍女導師 2 жыл бұрын
むしろ大多数の人間が間違えていてAIが正しいんじゃね?
@ppp-ry5gg
@ppp-ry5gg 2 жыл бұрын
パラメタが一個一個何を表してるのか気になるな
@my-nj6gq
@my-nj6gq 2 жыл бұрын
タイトルめっちゃ単位ベクトルに見えた笑
@優希-x4n
@優希-x4n 2 жыл бұрын
掃除機の1回出てきた「飼う」は絶対ドラえもんじゃん
@osigorisanda
@osigorisanda 2 жыл бұрын
支離滅裂な文を作るときに役立ちそう
@cocoadrink_014
@cocoadrink_014 2 жыл бұрын
単位ベクトルなんて概念があるのか、為になるなぁ。
@なむりん0624
@なむりん0624 2 жыл бұрын
ちょー面白い
@ずるん-z4r
@ずるん-z4r 2 жыл бұрын
飼う掃除機はルンバのことだろうね
@류해
@류해 2 жыл бұрын
掃除機は何で一回飼ったことがあるの?
@aaaaa-kq1dh
@aaaaa-kq1dh 2 жыл бұрын
猫と吸引って…中川翔子のことであってる?笑
@ジュピター-q4m
@ジュピター-q4m 2 жыл бұрын
東京ー日本=首都、首都+イギリス=ロンドンみたいな感じするもんなぁ
@一郎鈴木-d8e
@一郎鈴木-d8e Жыл бұрын
猫と吸うはもっと関連度高いと思います
@一汁三菜-t8d
@一汁三菜-t8d 2 жыл бұрын
いよいよ文系だからって言い訳が出来ない時代が来たな、、
@katsenberg3036
@katsenberg3036 2 жыл бұрын
最後んところの恐ろしい前兆… あえて作ったAIならばあまり偏見や差別の思想を残さないで作って欲しいですが
@Sean-y8m5h
@Sean-y8m5h 2 жыл бұрын
その場合、同義語は一次従属ですね
@JohnDoe-tn7ni
@JohnDoe-tn7ni 2 жыл бұрын
猫は吸うもの
@ももみかん-s3t
@ももみかん-s3t 2 жыл бұрын
Tay…手越?
AIにヒトの言葉は分かるのか?
8:43
ことラボ
Рет қаралды 91 М.
機械翻訳の歴史と仕組み
8:13
ことラボ
Рет қаралды 107 М.
How do Cats Eat Watermelon? 🍉
00:21
One More
Рет қаралды 12 МЛН
🍉😋 #shorts
00:24
Денис Кукояка
Рет қаралды 3,8 МЛН
pumpkins #shorts
00:39
Mr DegrEE
Рет қаралды 67 МЛН
Spongebob ate Patrick 😱 #meme #spongebob #gmod
00:15
Mr. LoLo
Рет қаралды 21 МЛН
「前」と「後ろ」が分からないとき見る動画
11:31
ことラボ
Рет қаралды 102 М.
これは「緑」なのか「青」なのか
10:52
ことラボ
Рет қаралды 210 М.
【ラテン語に入門しよう!】ラテン語って何?
8:37
かっけぇ〜ラテン語
Рет қаралды 5 М.
【数値化】言葉の足し算をするAIで遊んでみた
4:53
ラムダ技術部
Рет қаралды 188 М.
お嬢様って本当に「ですわ」っていうの?
7:45
ことラボ
Рет қаралды 132 М.
サルって結局しゃべれるの?
10:30
ことラボ
Рет қаралды 76 М.
パラドックスとは何か?
12:06
ことラボ
Рет қаралды 265 М.
ヒトの言語はどのようにして生まれたのか?
9:23
ことラボ
Рет қаралды 165 М.
日本人はなぜRとLが聞き分けられないのか?
8:41
ことラボ
Рет қаралды 150 М.
How do Cats Eat Watermelon? 🍉
00:21
One More
Рет қаралды 12 МЛН