株式会社ずんだもん技術室AI放送局 podcast 20241113
Description
関連リンク
Googleは、最新のGeminiモデルへのアクセスをOpenAIライブラリとREST API経由で提供開始しました。これにより、Geminiの利用が容易になります。
現時点では、Chat Completions APIとEmbeddings APIがサポートされ、今後数週間から数ヶ月で他のAPIとの互換性も追加される予定です。 Gemini APIの詳細は、Gemini APIドキュメントを参照してください。OpenAIライブラリを使用していない場合は、Gemini APIを直接呼び出すことを推奨しています。
ドキュメントには、Python、TypeScript/JavaScript、RESTを用いたGemini APIの使用方法のコード例が掲載されています。これらの例は、gemini-1.5-flash
モデルを使用してチャットボットとやり取りする方法を示しています。 APIパラメータの詳細については、APIリファレンスを参照してください。
Vertex AI Enterpriseのお客様は、OpenAIとの互換性もサポートされています。
簡単に言うと、Googleの強力なAIモデルGeminiが、OpenAIライブラリを通じてより簡単に利用できるようになったということです。 新人エンジニアの方でも、提供されたコード例を参考に、比較的容易にGeminiを自身の開発に活用できるようになっています。
引用元: https://developers.googleblog.com/en/gemini-is-now-accessible-from-the-openai-library/
OpenCoderは、英語と中国語に対応した、15億パラメータと80億パラメータのベースモデルとチャットモデルを含む、オープンソースで再現可能なコードLLM(大規模言語モデル)ファミリーです。2.5兆トークン(コードデータ90%、コード関連ウェブデータ10%)を用いてゼロから学習されており、最先端のコードLLMと同等の性能を実現しています。
本プロジェクトの大きな特徴は、その透明性と再現性の高さです。モデルの重みと推論コードだけでなく、再現可能なトレーニングデータ、データ処理パイプライン全体、厳格な実験結果、詳細なトレーニングプロトコルも公開されています。これにより、研究者はOpenCoderを基盤として、コードAIの研究開発を容易に進めることができます。
具体的には、以下のリソースが公開されています。
- OpenCoder: 複数のコードLLM評価ベンチマークで最先端の性能を達成した、完全にオープンソースのコードLLM。透明性のあるデータ処理パイプラインと再現可能なデータセットを基盤として構築されています。
- RefineCode: 607種類のプログラミング言語にわたる、9600億トークンからなる高品質で再現可能なコード事前学習コーパス。
- Instructive Ablation Studies: コードLLMの様々な設計上の選択肢やトレーニング戦略に関する有益な知見を提供することを目的とした、複数の意味のあるアブレーション実験の結果。
- 公開リソース: 最終的なモデルの重み、完全なデータ処理パイプライン、効率的な評価パイプライン、再現可能な事前学習データセット、大規模SFT(Supervised Fine-Tuning)データセット、中間チェックポイントなど。
簡単に言うと、OpenCoderは、高い性能と再現性を両立させた、オープンソースのコード生成AIです。 コードの生成や理解に関する研究開発に役立つだけでなく、その透明性から、LLMの開発手法や学習データの影響などを深く理解するための貴重なリソースとしても活用できます。 新人エンジニアの方にとっても、学習や研究に役立つ優れたツールと言えるでしょう。 公開されているデータやコードを参考に、LLMの仕組みや開発プロセスを学ぶことができます。
引用元: https://opencoder-llm.github.io/
LangChainは、プロンプトエンジニアリングを容易にする新しいツール「Prompt Canvas」を発表しました。これは、AIアプリケーション開発において重要なプロンプト作成を効率化し、最適化するための革新的なユーザーエクスペリエンスを提供するツールです。
従来のプロンプト作成は手作業で行われ、ベストプラクティスに従うための調整に時間がかかりました。Prompt Canvasは、LLM(大規模言語モデル)エージェントと協調的に作業することで、この課題を解決します。 インタラクティブなインターフェースにより、LLMエージェントからのフィードバックを受けながら、プロンプトを反復的に構築・改良できます。 これは、まるでAIと共同でドキュメントを作成するような感覚です。
Prompt Canvasは、チャットパネルとキャンバスの二つのパネルで構成されています。チャットパネルでは、LLMエージェントにプロンプト案の作成や修正を依頼したり、プロンプトに関する質問(長さの調整など)ができます。キャンバスでは、プロンプトの直接編集、特定テキストの選択によるフィードバック取得、そして「クイックアクション」による迅速な変更が可能です。
特に重要な機能として、「カスタムクイックアクション」があります。これは、組織内でプロンプト作成のベストプラクティスを共有し、標準化を促進するための機能です。 経験豊富なプロンプトエンジニアが作成したフォーマットやルールを、クイックアクションとして定義することで、他のエンジニアもワンクリックで簡単に適用できます。これは、まだ発展途上のプロンプトエンジニアリング分野において、知識の共有とチーム全体の効率向上に大きく貢献します。
Prompt Canvasは、LangSmith Playgroundで利用可能です。 より詳細な情報は、紹介動画をご確認ください。 このツールは、プロンプト作成をより協調的で効率的なプロセスにする強力なツールとなるでしょう。 新人エンジニアにとっても、直感的なインターフェースとLLMエージェントによる支援により、プロンプトエンジニアリングへの参入障壁を下げ、迅速な学習とスキル向上を支援します。
引用元: https://blog.langchain.dev/introducing-prompt-canvas/
株式会社セガ開発技術部有志による勉強会資料を一般公開したものです。高校数学レベルからの復習を踏まえ、大学初年度で学ぶ線形代数の基礎と、3次元回転の表現を解説しています。
概要:
この資料は、線形代数の基礎概念を簡潔に理解することを目的としています。特に、理工系分野で重要なベクトル、行列、そして3次元回転の表現に焦点を当てています。数体系の拡張から始まり、初等関数(指数関数、対数関数、三角関数)、ベクトル(内積、外積)、行列(行列式、逆行列、固有値・固有ベクトル)といった線形代数の基本事項を丁寧に解説しています。さらに、3次元回転の表現方法として、回転行列、オイラー角、回転ベクトル、クォータニオンを扱い、それぞれの特性や利点・欠点を説明しています。 各章には、理解を深めるための付録として、公式の証明や補足説明なども含まれています。演習問題は少ないため、必要に応じてインターネットなどを活用して学習を進めることを推奨しています。
制約:
- 行列は実数成分のn×n行列(実正方行列)のみを対象としています。
- 各項目の順番、手法、一部の定義は一般的なものとは異なる場合があります。
- ページ数の都合上、例題や演習問題は限られています。
この資料は、線形代数の基礎を学び直したい、または応用として3次元回転の表現を理解したい日本のエンジニア、特に新人エンジニアにとって、非常に分かりやすい入門書として役立つでしょう。 数式が多く含まれますが、図解や丁寧な説明によって理解を助ける工夫がされています。
引用元: https://speakerdeck.com/segadevtech/ji-chu-xian-xing-dai-shu-jiang-zuo
(株式会社ずんだもんは架空の登場組織です)