View Transcript
Episode Description
yasukawa0713さんをゲストに、gpt-ossを支える技術(アーキテクチャ、RoPEとYaRN、MXPF4など)ついて語っていただいたエピソードです。
話したネタ
- gpt-oss
- gpt-ossのモデルアーキテクチャ
- MoEの仕組みとメリット
- コンテキスト長を伸ばす工夫
- RoPEとYaRN
- 量子化とその手法
- MXFP4 とは
- gpt-oss で使われているトークナイザ
- BPE(Byte-Pair Encoding)とは
- Harmony Chat Format (HCF)とは何か、その概要
- Agentic Tool Use
- model cardで安全性周りで述べられていること
- gpt-oss の使用感
- rokadoc
See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.
