Navigated to 133. gpt-ossを支える技術 w/ yasukawa0713

133. gpt-ossを支える技術 w/ yasukawa0713

October 1
43 mins

View Transcript

Episode Description

yasukawa0713さんをゲストに、gpt-ossを支える技術(アーキテクチャ、RoPEとYaRN、MXPF4など)ついて語っていただいたエピソードです。

話したネタ

  • gpt-oss
  • gpt-ossのモデルアーキテクチャ
  • MoEの仕組みとメリット
  • コンテキスト長を伸ばす工夫
  • RoPEとYaRN
  • 量子化とその手法
  • MXFP4 とは
  • gpt-oss で使われているトークナイザ
  • BPE(Byte-Pair Encoding)とは
  • Harmony Chat Format (HCF)とは何か、その概要
  • Agentic Tool Use
  • model cardで安全性周りで述べられていること
  • gpt-oss の使用感
  • rokadoc


See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

See all episodes

Never lose your place, on any device

Create a free account to sync, back up, and get personal recommendations.