AudioLens を作る:音声プレビューとスペクトログラム解析のための VS Code 拡張機能
最近、VS Code の中で音声を読み込み、再生し、解析できる拡張機能を Vibe した。名前は AudioLens。
いくつかの音声アルゴリズム系のグループで共有してみたところ、反応はなかなか良かった。
最近、VS Code の中で音声を読み込み、再生し、解析できる拡張機能を Vibe した。名前は AudioLens。
いくつかの音声アルゴリズム系のグループで共有してみたところ、反応はなかなか良かった。
この記事はもともと、社内共有のために準備していた発表原稿の下書きとして書き始めたものだ。ただ、その中で公開しても再利用できる部分を整理し、ブログ記事としてまとめることにした。なので、社内リポジトリや社内フロー、社内事例のような内容は意図的に避け、できるだけ多くの開発者にとって再利用可能な方法論、仕事の習慣、考え方の変化だけを残すつもりでいる。
この記事の主な読者として想定しているのは、まだ IDE ベースの補助的コーディングや、大規模モデルの Web チャット機能を使ってはいるものの、Claude Code や Codex CLI のようなコマンドラインツールはまだあまり使ったことがない人たちだ。だからこの文章で伝えたいのは、なぜ CLI ツールこそが未来なのか、そして CLI ツールの入門的な使い方を大まかに紹介することだ。
この文章の核心を一言で要約するなら、こうなる。大規模モデルによる補助的コーディングは出発点にすぎず、Vibe Coding は新しい働き方そのものだ。 それは単に「IDE にチャット欄が 1 つ増えた」ことでもなければ、「AI にコード補完を手伝わせる」ことでもない。むしろ、「コードを書く」という行為そのものが、少しずつ「目標を説明し、過程に制約を与え、結果をレビューし、システムを反復的に改善する」プロセスへと再構成されていくことに近い。そして後者に必要なのは、自然言語で Agent と対話することだけだ。
最近、Codex を使って初心者向けのリーチ麻雀サイトを作った。https://simzhou.com/riichi_mahjong_book/en/
カバー画像: The Stanley Parable。主人公スタンリーはオフィスビルの Employee 427 であり、彼の日々の仕事はコンピュータの指示どおりにひたすらキーを押し続けることだった。
まず 1 つはっきりさせておきたい。この文章は、ここ最近私が観察してきた現象と、そこから生まれた考えや感想だけをもとに書いている。すべての文は手で打ち込んだものであり、この記事の執筆には AI を一切使っていない。
原著者: Kangwook Lee
元記事: https://x.com/Kangwook_Lee/article/2028955292025962534
codex 以外のモデルでは、オープンソースの Codex CLI はローカルでコンテキスト圧縮を行います。LLM が compaction prompt を使って会話を要約します。後でその圧縮済みコンテキストを使うときには、responses.create() がその要約を位置づける handoff prompt と一緒に受け取ります。これらのプロンプトはどちらもソースコード上で確認できます。
この投稿はずっと前から書きたかった。ようやく ECharts をブログの中で動かせるようになったので、きちんと形にできた。
今回の目的はシンプルだ。L1 正則化と L2 正則化を「見える」ようにすること。式だけで語るのではなく、交差エントロピー損失面が 3D 空間でどう変形するかを見ていく。そうすると、いくつかの抽象的な考え方がぐっと理解しやすくなる。特に、なぜ L1 正則化が疎なモデルを生みやすく、結果として特徴選択のように振る舞うのかが直感的に分かる。