Discover
AI Shift Academy
AI Shift Academy
Author: 株式会社AI Shift
Subscribed: 2Played: 31Subscribe
Share
© 株式会社AI Shift
Description
サイバーエージェントグループ・株式会社AI Shiftが提供する、AI技術の進化をストーリーとして読み解く、AI教養ポッドキャストです。
▼おたよりフォーム
ご意見・ご感想は下記よりお送りください。
https://forms.gle/djeA4bbMgVkJMdK79
▼各種リンク
AI Shiftホームページ:https://www.ai-shift.co.jp/
AI Shift Xアカウント:https://x.com/AIShift_PR
及川(パーソナリティ):https://x.com/cyber_oikawa
戸田(パーソナリティ):https://x.com/Trtd6Trtd
▼おたよりフォーム
ご意見・ご感想は下記よりお送りください。
https://forms.gle/djeA4bbMgVkJMdK79
▼各種リンク
AI Shiftホームページ:https://www.ai-shift.co.jp/
AI Shift Xアカウント:https://x.com/AIShift_PR
及川(パーソナリティ):https://x.com/cyber_oikawa
戸田(パーソナリティ):https://x.com/Trtd6Trtd
50 Episodes
Reverse
AI Shift Academy(#シフアカ)前回に引き続き、ボイスボット開発の現場を支えるエンジニアたちが、LLM(大規模言語モデル)の登場による「破壊的進化」と、その裏に隠された「泥臭い苦労」を赤裸々に語ります。【今回のトピック】LLMと「速度」の壁: 0.1秒の遅延が致命傷になる音声会話の世界。「間(ま)」の恐怖: 人間はなぜ1秒の無音に耐えられないのか?フィラー(えーっと、少々お待ちください)の重要性: 違和感を消すためのエンジニアの工夫。音声認識の罠: 「チャンネル登録お願いします」と勝手に話し出すハルシネーション問題。技術の総合格闘技: 音声認識、LLM、音声合成を組み合わせる難しさ。最先端のAI技術を「実用」レベルに落とし込むための、現場ならではの試行錯誤が詰まったエピソードです。ぜひ最後までお楽しみください!▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回のテーマは、以前も取り上げたボイスボット(音声対話システム)開発の裏側に迫る第二弾前編です。LLM登場以前、ボイスボットはIVR(自動音声応答)と併用されることが多く、開発現場では特有の課題がありました。・「55」や「9」など、数字・アルファベットの音声認識の難しさ・「はい/いいえ」の単純な質問に、ユーザーが長々と背景を語ってしまう問題・渋谷、戸田市、246号線など、地名や略称の認識エラー・ハンズフリー通話による雑音混入と認識精度の低下など、テキストのチャットボットにはない音声ならではの苦労話をAI Shiftの二人が語ります。▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回のテーマは「SF作品と現在のAI」。MLエンジニアの曽田が、AI開発に携わる今だからこそ感じるSF作品のリアリティや、現代技術との共通点について語ります。星新一『肩の上の秘書』に見るChatGPT的な意図解釈、アイザック・アシモフ『われはロボット』から考えるAIへの愛着、テッド・チャン作品における「AIの育成」など、古典SFが示唆していた課題を深掘り。また、カスタマーサポートAIに「謝罪」を求める人間の心理や、AIアバターに対する独特なコミュニケーションなど、技術の進化に伴う人間側の行動変容についても議論します。SFはもはや予言書?技術者視点のSFトークをお楽しみください!【トークテーマ】星新一『肩の上の秘書』とChatGPTアシモフ『われはロボット』とAIへの愛着テッド・チャン作品とAIの育成AIに対する人間の心理・行動▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回は、2023年の登場以降、再び注目を集めている「ローカルLLM」を特集!クラウド型のAI(ChatGPTやGeminiなど)が主流の今、なぜあえて自前環境でAIを動かす「ローカル」が熱いのか?そのメリットから最新の技術動向まで、エンジニアの視点で分かりやすく深掘りします。ローカルLLMとは?:自前環境でAIを動かす定義と、OSS(オープンソース)との違いなぜ今、再注目されているのか:モデルの軽量化やハードウェアの進化、精度の向上についてローカルLLMを選ぶ4つの理由:機密性とセキュリティ:社外秘データを安全に扱うコストパフォーマンス:高リクエスト環境での逆転現象ガードレールのカスタマイズ:特定の役割への特化(悪役ロールプレイなど)文化的多様性と安全保障:日本独自の文化継承やAI自給率の観点主要モデル紹介:Llama 3、Qwen、Gemma、DeepSeekなど、今すぐ試せる注目モデル手軽にローカルLLMを試してみたい方は、以下のソフトウェアがおすすめです。Ollama:エンジニア以外でも使いやすいUILM Studio:直感的な操作でモデルを動かせる▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回は、前回に引き続き「LLM登場以前のチャットボット」の歴史と技術(後半)です。シナリオ型(ルールベース)ならではの、「無限に増える分岐」や「表記ゆれへの対応」など、当時の泥臭い開発の裏側を語ります。【今回のハイライト】シナリオ型の限界:複雑化する分岐とメンテナンスの地獄、「その他」ばかり選ばれる問題。言葉のゆらぎ:「はい/いいえ」で答えられない曖昧な返答や、表記ゆれ(iPhone vs アイフォンなど)への手動対応。人間 vs ボット:文脈を無視した相談や、ボット相手への不満など、コミュニケーションの難しさ。今ではChatGPTなどが自然に行っている処理も、当時は手動と工夫で乗り越えていました。技術の進化と当時のエンジニアの奮闘をぜひお聴きください!▼おたよりはこちらから
AI Shift Academy(#シフアカ)チャットボットの「FAQ型」と「シナリオ型」の違いと、それぞれの運用課題について深掘りします。FAQ型は、ユーザーの質問に対して事前に用意したQ&Aから回答を検索するタイプ。一見シンプルですが、実際には・表記ゆれや類義語の認識精度・「解決しましたか?」というフィードバックボタンの押下率の低さ・質問意図の汲み取り不足など、運用担当者を悩ませる課題が山積みです。これらの課題に対する具体的な解決策や、ユーザー体験を向上させるためのヒントを語ります!▼おたよりはこちらから
AI Shift Academy(#シフアカ)後編では、RAGシステムの運用フェーズにおけるリアルな課題に迫ります。RAGを導入したものの、精度評価が難しく、結局担当者の感覚(バイブス)で「良くなった気がする」と判断してしまう「バイブスチェック問題」。定量的な評価指標の欠如や、ユーザーの質問リテラシーによる検索精度のばらつきなど、運用現場ならではの悩みを紹介します。さらに、AIに過度な期待を寄せる「魔法の箱」幻想と現実のギャップ、そして継続的なナレッジ更新の難しさについても議論します。▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回はAIワークフロー構築において欠かせない技術「RAG(検索拡張生成)」の現場の課題に焦点を当てます。#1でも取り扱いましたが、AIに社内ドキュメントなどの外部知識を参照させるRAG。一見便利な技術ですが、実際に開発してみると・表記ゆれやフォーマットの乱れによる検索精度の低下・LLMへのコンテキスト過多によるハルシネーション・「分かりません」と正直に言えないAIの挙動など、様々な壁にぶつかります。AI ShiftのMLエンジニア目線で、実務で直面した具体的な課題と、現時点での解決アプローチを赤裸々に語ります。▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回は、AI開発の現場で起こりつつある新たな課題「AIワークフローのコンテキストオーバー」について、AI Shiftの及川と戸田が深掘りします!複数のAI処理を繋げて自動化する「AIワークフロー」・プロンプトに気合いを入れすぎて情報過多に・1つのワークフローに詰め込みすぎて複雑化など、中級者が陥りがちな落とし穴を実例を交えて解説。「Few-Shot」が逆にハルシネーションを招いた失敗談や、業務棚卸しの重要性など、2025年以降のAI開発に必須の知見をお届けします。▼おたよりはこちらから
AI Shift Academy(#シフアカ)前回に続き、ボイスボット開発の裏側を深掘り!今回は、AIと人間らしい対話を実現するための試行錯誤に焦点を当てます。・ ストリーミング認識の落とし穴スムーズな会話のために導入したストリーミング認識。しかし、「どこで会話を切るか」という難問に直面。ボットが「ずっと空気を読んでしまう」現象とは?・ 人間らしさ vs 機械のわかりやすさ人間のような「間」や「相槌」は本当に必要なのか?あえて機械的に振る舞うことで、ユーザーの心理的ハードルを下げる逆説的なUX設計について議論します。・ アバター接客の衝撃体験ホテルでのアバター接客から見えた、プロの接客術とAIの現在地。最新のLLMでも超えられない「文脈理解」の壁とは?・ 割り込み機能「バージイン」の失敗談ユーザー体験向上のために実装した「割り込み機能」が、なぜ全く使われなかったのか?技術とユーザー心理のギャップに迫ります。▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回のシフアカは、方向性を変えて開発の「現場トーク」をお届けします!テーマは、AI Shiftのプロダクト「ボイスボット」の立ち上げ秘話。2019年、ボイスボットの始まりは「秘書さんサポート」だった!?「土日」が「兄貴」に聞き間違えられるなど、精度がまだ低く、運用が定まっていなかった当時の音声認識とどう戦ったのか。・独自の「聞き間違い辞書」の作成・「こう言ってください」と誘導するUXの工夫など、LLM登場以前のエンジニアの泥臭い試行錯誤を語ります!▼おたよりはこちらから
AI Shift Academy(#シフアカ)パイプラインからE2Eへ!最新音声対話技術の現在地 人間のように自然で低遅延な対話を実現する「E2E型音声モデル」へのパラダイムシフトを徹底解説します。・ Half-duplex vs Full-duplex爆速応答の「LLaMA-Omni」と、話しながら聞く同時双方向を実現する「Moshi」。それぞれのアーキテクチャと訓練手法の違いとは?・ 技術の裏側OpenAI Realtime APIの「擬似」Full-duplexの仕組みや、音声コーデック「Mimi」によるトークン化(Semantic/Acoustic)の構造を深掘り。・ 課題と展望対話データの不足やセキュリティ評価、今後のマルチモーダル化について議論します。音声AIの最前線をキャッチアップしたい方は必聴です!▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回のテーマは「対話システムの歴史と未来」です。音声対話の基礎となるテキスト対話の進化を、1966年の元祖ELIZAから最新のLLMまで深堀りします。・ELIZAとSHRDLU:黎明期の対話と擬人化現象・主導権の変遷:一方通行から混合主導型へ・技術の進化:ルールベースから確率モデル、深層学習へChatGPT以降、AIは言葉を理解できるようになりました。では次の競争軸は何か。答えは理解の正確さから「体験の心地よさ(UX)」へのシフトです。技術の先にある、これからの対話デザインの核心に迫ります!▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回のテーマは、音声対話システムの核心「対話制御とモデルの変化」について。ユーザーの発話をAIはどう理解し、記憶し、次の応答を決めているのか?NLU(理解)→DST(記憶)→Policy(決定)という「対話の脳みそ」の仕組みを徹底解説します!▼主なトピック・ASR(音声認識)のストリーミング進化・対話制御3モジュールの役割と連携・LLM登場による「パイプライン型」から「End-to-End型」への構造変化・精度と柔軟性を両立する「ハイブリッド型」の現実解「AIがどう考えて話しているか」を知れば、技術トレンドがより深く見えてきます。是非ご視聴ください!▼おたよりはこちらから
AI Shift Academy(#シフアカ)なぜ私たちはスムーズに会話のキャッチボールができるのでしょう?今回のテーマは「ターンテイキング」(話す・聞くの順番交代)です。人間は相手の話の終わりを予測し、わずか0.2秒で交代していると言われます。この複雑な仕組みをAIでどう実現するのか?ターンテイキングの基礎、読み取る手がかり(声のトーン、視線など)から、LLMを活用した最新AIモデル(Turn GPT, VAP)、音声対話システムでの重要性(UX向上、「バージイン(割り込み)」)まで詳しく解説。会話AIの「間(ま)」の秘密に迫ります!▼おたよりはこちらから
AI Shift Academy(#シフアカ)ChatGPTのボイスモードなど、AIと「声」で話す仕組み=「音声対話システム」が急速に進化しています。かつては、(1)音声検出 → (2)文字化 → (3)意図理解 → (4)文脈把握 → (5)応答決定 → (6)文章生成 → (7)音声合成、という7つの専門分野を組み合わせる「パイプライン型」が主流でした。しかし、この方法ではエラーが伝播しやすく、全体最適化が困難でした。現在は、LLMを中心に多くを統合する「End-to-End型」が標準に。さらに、音声のトーンや感情をそのまま理解する研究も進んでいます。とはいえ、人間のように自然な「間」で会話を切り返す「ターンテイキング」や応答速度にはまだ課題も。音声対話の技術的な変遷と未来の課題を解説します!▼おたよりはこちらから
AI Shift Academy(#シフアカ)#2番外編として、ゲストパーソナリティの栗原から、言語処理学会「YANS」について紹介します。毎年実施されている言語処理学会「YANS」20代〜30代前半の研究者が中心で、活気ある雰囲気が特徴です。発表者と直接対話できる「ポスターセッション」がメインとなっており、参加者が自由にディスカッションできる場となっています。番組では、特に印象的だった研究として、「言い淀み」や「ノリ」といった即興性を含むリアルな会話の再現を目指す「自発音声」の研究を紹介。また、LLM(大規模言語モデル)を活用したデータセット作成など、学会で見られた最新の研究トレンドにも触れています。AI研究の最前線がわかるエピソード、ぜひお聴きください!▼おたよりはこちらから
AI Shift Academy(#シフアカ)AIの「賢さ」を測るモノサシが変わる?従来の「難しい問題が解けるか」という評価(ベンチマーク)だけでは、AIの真の実力は測れなくなりつつあります。これからのAI評価は、・ウェブ探索能力 (BrowseComp)・ツールの使い方 (LiveMCP)・研究能力や洞察の深さ・マルチモーダルや対話能力など、より実践的なスキルが問われます。また、「Chatbot Arena」のようなユーザー投票や、人間が評価ループに入る「Human-in-the-Loop」も再注目されています。「AI版ムーアの法則」と呼ばれるタスク完遂速度や、安全性・バイアス(RedTeaming, HELM)など、評価軸はどんどん複雑で多角的に。AI評価の未来を解説します!▼おたよりはこちらから
AI Shift Academy(#シフアカ)TECH BLOG「LLM-as-a-Judgeにまつわるバイアスまとめ」はこちらから。今回は「AIの評価」評価における課題についてお話しています。特にLLMの性能評価における信頼性の問題を深掘りします。今回の放送では、AI評価者や人間に内在し、結果を歪める「バイアス」の体系的な分析から始めます。さらに、評価データが学習データに混入する「データ汚染」が如何にベンチマークを無意味にするか、そして評価AIの癖に最適化し実用性を損なう「ジャッジへの過適応」の危険性を指摘。問題設定自体の誤りや環境依存性といった、スコアの再現性を揺るがす要因も解説。AIの能力を正しく見極める上で、開発者や研究者が直面する深刻な課題を論じます。▼おたよりはこちらから
AI Shift Academy(#シフアカ)今回は「AIの評価」LLM as a Judgeについてお話しています。従来のAI評価は、自動指標では精度に、人手評価ではコストと時間に大きな課題がありました。そこで登場したのが、GPTのような高性能LLMを「評価者」として使う新手法「LLM as a Judge」です。人間による評価と遜色ない精度を実現しつつ、高速・低コストで大規模な評価を可能にします。評価の質はプロンプト設計が鍵を握り、明確な基準を与えることで人間の判断をスケールさせることができます。RAGの性能評価や、AIからのフィードバックでAIを強化するRLAIFなど応用も多彩。AI開発の常識を変えるこの技術を詳しく解説します!▼おたよりはこちらから




