【AI】ChatGPTの6500倍多く学習した…ネイバーの韓国語AI公開

1田杉山脈 ★ID:ZkFG1/3S2023/08/26(土) 22:57:40.40

検索→モバイル→eコマースにつながったネイバー(NAVER)の成長エンジンのバトンを生成AI(人工知能)が引き継ぐことができるだろうか。ネイバーが最新の巨大言語モデル(LLM)「ハイパークローバーX」を公開した。ネイバーのサービス全般をハイパークローバーXとリンクさせるのと同時に、各企業に最適化した企業向けサービスで収益を上げるという戦略だ。

ネイバーは24日、ソウル三成洞(サムソンドン)で「チームネイバーコンファレンスDAN23」を開催し、ハイパークローバーXを披露した。ハイパークローバーXは2021年にネイバーが世界で3番目に公開したLLM「ハイパークローバー」のアップグレードバージョンだ。ハイパークローバーXはChatGPT(チャットGPT)より韓国語データを6500倍多く学習したという。ネイバーはハイパークローバーXを作るために最近5年間、AI分野だけで1兆ウォン以上を投資した。この日ネイバーの崔秀姸(チェ・スヨン)代表は「多様なサービスでクリエイター・事業者・広告主・パートナーを結び付け、彼らが成長して再びプラットフォームの成長を導くウィニング・ループ(winning loop、勝利の好循環)が我々の成功の公式」とし「このループにハイパークローバーXを加えて成功の速度を加速させる」と述べた。ただ、ネイバーは「パラメータの規模はLLMの核心的ノウハウ」とし、公開しなかった。

ネイバーはハイパークローバーXの多様な用途を公開した。この日午後4時にテスト・サービスを始めた「クローバーX」はChatGPTのような対話型AIサービスだ。クローバーXはネイバー内・外部サービスのAPI(応用プログラムインターフェース)を連動させ、生態系拡張を狙う。利用者がクローバーXでソカー(カーシェアリング)、配達の民族(デリバリーアプリ)、カーリー(食品配達サービス)、ヤノルジャ(宿泊・レジャー予約)サービスをつないで利用できる。例えば「子供と一緒に乗るのに良いレンタカーを推薦して」と言えば、ソカーのレンタカーの中で適した車種の情報を見せ、予約までリンクがつながる。

今年11月からネイバー統合検索に順次適用されるキュー(QUE)は複雑な質問も理解する検索サービスだ。利用者が「週末に盆唐(プンダン)でブランチを食べるのに良いテラスのあるレストランを探して」と質問すれば、適したレストランを推薦し、レストランのイメージ、レビュー、営業時間などを編集して提供するという形だ。ネイバーはクリエイター・事業者のために作文ツール「クローバー・フォー・ライティング」と広告主のための生成型AI基盤広告商品「クローバー・フォー・アド」もリリースする。

企業間取引(B2B)分野はLLMを通じてどのように収益を上げるかに関するネイバーの方向性を示している。「プロジェクトコネクトX(Project CONNECT X)」は生産性ツールだ。メッセンジャー、メールなど色々な経路で来る業務指示をAIが統合して実行計画を立て、報告書、電子メールの草案も作ってくれる。まずネイバー社内で使い、今後、他の企業に提供する。

ネイバーは企業向けAIサービスとして「ニューロクラウド」もリリースした。LLMの独自開発が難しい企業にハイパークローバーXを提供し、クラウドを企業内に置く方式でデータセキュリティを保障するサービスだ。このようなネイバーのB2BAI技術は、すでにサムスン電子DS(半導体)部門とのAI半導体協業に使われている。

同日、ネイバーの株価が一日で6.25%値上がりするほど、市場の反応は肯定的だ。しかし、グローバルLLMモデルで提起されたハルシネーション(hallucination、幻覚)エラーはハイパークローバーXにも残っている。 生成AIサービスが虚偽の情報をもっともらしい事実のように答える技術的エラーだ。これについてネイバーは、出所が明確な文書を使用する技術で回答の精度を高めたと説明する。AI学習用コンテンツの著作権侵害問題も懸念材料だ。
https://japanese.joins.com/JArticle/308261

引用元:https://egg.5ch.net/test/read.cgi/bizplus/1693058260/

2名刺は切らしておりましてID:0sLfbGDb2023/08/26(土) 23:02:05.06

反日、用日の仕方を学びました
3名刺は切らしておりましてID:0sLfbGDb2023/08/26(土) 23:02:11.93

反日、用日の仕方を学びました
4名刺は切らしておりましてID:Qb55sfxy2023/08/26(土) 23:05:03.68

片寄り具合に興味がある
5名刺は切らしておりましてID:Qb55sfxy2023/08/26(土) 23:05:18.70

片寄り具合に興味がある
6名刺は切らしておりましてID:Qb55sfxy2023/08/26(土) 23:06:34.61

片寄り具合には興味が湧くな
7名刺は切らしておりましてID:fqWVXBcp2023/08/26(土) 23:10:13.08

お前らのラインの会話のやり取りが学習で利用できたニダ
チョッパリ、パンチョッパリ、安部ちゃん、ありがとうニダ
日本AIプロジェクト 日本語デーがないでござる!つんでた!ww
ウエエエエエエハツツツツツツツツツツツツツツツツツ
8名刺は切らしておりましてID:fqWVXBcp2023/08/26(土) 23:14:38.05

安部ちゃんと孫さんは、栄誉韓国人ネバ!
9名刺は切らしておりましてID:Gx8k3Lsc2023/08/26(土) 23:18:43.40

マスコミって何で英文を全角で書くんだよ。
半角で書けよ。
38名刺は切らしておりましてID:FlnNqeTy
>>9
本来の用途が縦書きの新聞原稿だから。
10名刺は切らしておりましてID:G51MI+7F2023/08/26(土) 23:22:42.52

竹島については幼稚園児レベルのデタラメでしょうね
11名刺は切らしておりましてID:S5utkuVL2023/08/26(土) 23:22:55.83

なんか既に発狂してそう。
13名刺は切らしておりましてID:6hQd2npy2023/08/26(土) 23:27:04.57

嘘しか吐かない生成AIとかwww
14名刺は切らしておりましてID:v/FeVFcT2023/08/26(土) 23:27:55.18

日本漁民を大虐殺した
超汚染塵がどのパンスト面(つら)下げて被害者ぶってんだ?
超汚染塵は日本に対しても二日市保養所の悲劇、竹林ヨーコ、
戦後間もない頃の、在日超汚染塵進駐軍の暴力、
竹島侵略、日本民間人を44名射殺(遺体回収数)、行方不明者多数、3千名以上を拷問監禁、人質強迫外交・・・。
超汚染塵こそ、日本にも牙をむく戦争犯罪国だろ。
超汚染塵の分際で、被害者ぶるなよ!
超汚染塵共を殺せ!消し去れ!!殲滅せよ!!!

ころせーころせーころせーころせー
超汚染塵どもが日本の水道水に毒を入れる前にkill all gooks on the earth
神國日本に居座る超汚染塵どもを福一デブリに叩き落とせ
Drop Dead ‘Unko’rean
Go to hell ,6cm dicks

15名刺は切らしておりましてID:CoVzx95a2023/08/26(土) 23:29:30.30

学習データが多くても内容が偏っていたらダメだろw
16名刺は切らしておりましてID:wkbrFETo2023/08/26(土) 23:31:08.23

竹島漁民の虐殺について教えてちょ
17名刺は切らしておりましてID:Jl8pqeNo2023/08/26(土) 23:34:24.10

息を吐くように嘘を吐くAIか
胸熱だな
18名刺は切らしておりましてID:rbNJuZNx2023/08/26(土) 23:34:33.28

そんなに学習させたら過学習でまともに使えんだろう
19名刺は切らしておりましてID:KrYF4mkC2023/08/26(土) 23:38:20.11

うそくせぇ、ほんとか?
41名刺は切らしておりましてID:HTyH2b4p
>>19
本当だよ
韓国語に限っての話だからね

自サイトのチャットやSNSでのユーザー間のやり取りとかも学習データに使ってるから流石にgoogleもデータ量では勝てない
というかそもそもGoogleがハングル学習に本腰入れとらんし

20名刺は切らしておりましてID:Ha6AL2bk2023/08/26(土) 23:58:21.27

GPTはたまに狂人スイッチ入るのが面白いな
21名刺は切らしておりましてID:U9JqWLnm2023/08/27(日) 00:00:13.10

ハングルって平仮名と同じく発音記号でも有るから、
漢字なしで平仮名だけで書かれた文章で学習すると
とんでもない文字数になるのは、容易に想像出来ます。
22名刺は切らしておりましてID:jzHT3yUC2023/08/27(日) 00:07:39.24

日本漁民を大虐殺した
超汚染塵がどの面(つら)下げて被害者ぶってんだ?
超汚染塵は日本に対しても二日市保養所の悲劇、竹林ヨーコ、
戦後間もない頃の、在日超汚染塵進駐軍の暴力、
竹島侵略、日本民間人を44名射殺(遺体回収数)、行方不明者多数、3千名以上を拷問監禁、人質強迫外交・・・。
超汚染塵こそ、日本にも牙をむく戦争犯罪国だろ。
超汚染塵の分際で、被害者ぶるなよ!
超汚染塵共を殺せ!消し去れ!!殲滅せよ!!!

ころせーころせーころせーころせー
超汚染塵どもが日本の水道水に毒を入れる前にkill all gooks on the earth
神國日本に居座る超汚染塵どもを福一デブリに叩き落とせ
Drop Dead ‘Unko’rean
Go to hell ,6cm dicks

23名刺は切らしておりましてID:IB0b+/mZ2023/08/27(日) 00:11:21.66

がんばれ チョンAI 真実になんか負けるな
24名刺は切らしておりましてID:yBeaGfk82023/08/27(日) 00:30:31.86

色んな国の色んな企業が自社のチャットAIを開発してるからChatGPT一強の時代はもう終わりだな
少なくともOpenAIはGAFAMみたいな市場の独占はできない
30名刺は切らしておりましてID:/S0WwGJk
>>24
まだchatGPT一強だよ。未だにchatGPTのように何でもこなして、回答精度も高いAIは無いと思う。Bardが多少追いついてきてるけど。他のオープンソース化してるものは全然追いつけてない。評価スコアが高くても実際の利用ではまだまだ。
34名刺は切らしておりましてID:R3SRKr7o
>>30
回答精度はそろそろ頭打ちだと思う

GPT4が3.5より遥かに精度が高いのはパラメータ数が精度に大きく影響するからだけど、コスト面や物理的な制約から4より大きくするのは今の人類の技術ではかなり厳しい

そうすると次に物を言うのは学習データの量だけど、GPT1から5年くらいかけて育ててきたGPT3.5の精度に同じ無料枠・同程度の返答速度を持つBardがわずか半年弱で肉薄している(分野によっては超えている)

ということはGPT3.5・Bardをある程度大きくしたくらいの学習モデルサイズなら1年も人間からのフィードバックを学習させ続ければ精度の上限に達するわけで、少なくともBardを一般に公開してるGoogleやAWS顧客が継続的にAIサービスを利用するであろうAmazonは精度を上げてOpenAIの潜在的顧客を奪える

逆にオープンソースはフィードバックを得るためにサービスとして公開して運用するコストを払い続けられるか怪しいものも多いから大半はこの先厳しいと思う

25名刺は切らしておりましてID:mVp0XCEZ2023/08/27(日) 00:35:53.54

色々壊れちゃったんだな
26名刺は切らしておりましてID:VGM2FYBZ2023/08/27(日) 00:41:22.48

オデン文字って漢字かな混じりと違って情報量少ないからね。。6500倍でも足りないんじゃない?
元々質の悪いものは質の悪い結果しか生成しないよ?わかってなくないか?
27名刺は切らしておりましてID:of4u5Rok2023/08/27(日) 01:26:28.70
28名刺は切らしておりましてID:iQxxImHd2023/08/27(日) 01:42:56.33

6500×0(チョン製)=0で終わりwww
29名刺は切らしておりましてID:/S0WwGJk2023/08/27(日) 02:40:34.41

何が6500倍なのかよく分からん。パラメータ数が6500倍なのか?でもパラメータ数多くても学習内容次第だからな。
31名刺は切らしておりましてID:zxx5HvO52023/08/27(日) 03:34:02.06

相変わらず嘘ばっかりの下朝鮮は超電導だって言い張って海の底に全員沈んで欲しい
32名刺は切らしておりましてID:ua1pCOVB2023/08/27(日) 03:39:09.99

学習させても大統領代わる毎に歴史も修正されるんだから歪みでAIも火病になるんしゃない?
33名刺は切らしておりましてID:QFnwbp0K2023/08/27(日) 03:51:00.99

エロありのAIまだ?
35名刺は切らしておりましてID:iSA0r/8i2023/08/27(日) 04:16:18.43

人を罵る事にかけてはChatGPTの6500万倍
36名刺は切らしておりましてID:l3hZa4Mb2023/08/27(日) 07:35:25.15

=T=i=k=T=o=k(←迷惑でしたらこちらをNGしてください。)

更に家族に教えて、追加で¥3500をGET可能!

View post on imgur.com


37名刺は切らしておりましてID:NUA92b5K2023/08/27(日) 07:47:40.38

法螺貝
電話
FAX

無縁デス!

39名刺は切らしておりましてID:JcQ3yFFu2023/08/27(日) 08:37:01.38

はは、ナイスジョーク!
40名刺は切らしておりましてID:On2S+u5A2023/08/27(日) 08:52:42.15

重くなって終了の予感
42名刺は切らしておりましてID:qhSxkZ9f2023/08/27(日) 10:17:57.51

女性100人が下着姿でカメラの前に立つ「他人と違う体型は自分だけの個性」
https://hfgyuik.christianlux.org/0827/n7h0ufz1.html
https://hfgyuik.christianlux.org/0827/n7h0ufz1.html
43名刺は切らしておりましてID:vVjvVe832023/08/27(日) 10:48:38.35

韓国語データを←
火病持ったAIは世界初だろうな
44名刺は切らしておりましてID:ph27Yh5d2023/08/27(日) 11:19:49.05

今日俺んちに広瀬すずくるんだぜ!
明日はアリスだぜ!羨ましいだろ!
45名刺は切らしておりましてID:w3pqUo6A2023/08/27(日) 11:58:49.53

ネトウヨがどれだけイキっても、AIランキングでは日本より韓国の方が上だからな
46名刺は切らしておりましてID:YeDDmGiy2023/08/27(日) 12:17:31.85

日本漁民を大虐殺した
超汚染塵がどのパンスト面(つら)下げて被害者ぶってんだ?
超汚染塵は日本に対しても二日市保養所の悲劇、竹林ヨーコ、
戦後間もない頃の、在日超汚染塵進駐軍の暴力、
竹島侵略、日本民間人を44名射殺(遺体回収数)、行方不明者多数、3千名以上を拷問監禁、人質強迫外交・・・。
超汚染塵こそ、日本にも牙をむく戦争犯罪国だろ。
超汚染塵の分際で、被害者ぶるなよ!
超汚染塵共を殺せ!消し去れ!!殲滅せよ!!!

ころせーころせーころせーころせー
超汚染塵どもが日本の水道水に毒を入れる前にkill all gooks on the earth
神國日本に居座る超汚染塵どもを福一デブリに叩き落とせ
Drop Dead ‘Unko’rean
Go to hell ,6cm dicks
ライダイハンを忘れるなRemember LaiDaiHan

48名刺は切らしておりましてID:WghLS6V02023/08/27(日) 12:39:54.56

6500倍、ゴミクズ情報を溜め込んだ
49名刺は切らしておりましてID:DoAH7Slr2023/08/27(日) 12:40:03.18

クローラーは巧妙に偽装しているのかいないのか
ほとんどそれらしいのは見かけんな 中台っぽいのがよくいる程度 欧州経由の奴は正体不明

コメント