Works & Software
学術研究と並行して、実用的なソフトウェア開発も積極的に行っています。 特にTwitchストリーミング向けの音声認識・翻訳ツールでは、配信コミュニティから高い評価を得ています。
開発者として
「さよなりω」の名前で、Twitchストリーミングコミュニティ向けの 音声認識・翻訳ツールの開発者として知られています。研究で培った音声処理技術を 実用的なソフトウェアとして社会に還元し、多くのストリーマーや視聴者に利用されています。
🌟 Featured Project
音声認識字幕ちゃん
PopularGoogleChrome上で動作するリアルタイム音声認識+翻訳システム。音声を字幕として表示でき、 字幕の表示スタイルを簡単に設定できます。ブラウザベースのため軽量で使いやすく、 ストリーミング配信やプレゼンテーションに最適です。
主な機能
- リアルタイム音声認識による字幕生成
- 音声の多言語翻訳機能
- 字幕表示スタイルのカスタマイズ
- ブラウザベースで軽量動作
- ストリーミング配信対応
Twitchチャット翻訳ちゃん
Cross-PlatformWindows、MacOS、Linuxに対応する配信チャット欄の翻訳ツール。Twitchストリーマー向けに開発され、 多言語チャットの翻訳を行うことで国際的なストリーミング配信をサポートします。 CUI版とGUI版の両方を提供しています。
主な機能
- Twitchチャットの多言語翻訳
- Windows、MacOS、Linux対応
- CUI版とGUI版の2つのバージョン
- リアルタイム翻訳処理
- カスタマイズ可能な設定
🔧 Open Source Projects
字幕表示用の不適切単語管理リポジトリ
音声認識字幕システムで使用される不適切単語のフィルタリング用データベース。 ストリーミング配信での音声認識結果をクリーンに保つための単語リストを管理し、 コミュニティによる継続的な改善が可能な仕組みを提供しています。
特徴
- 配信向け不適切単語フィルタリング
- コミュニティベースの単語管理
- 音声認識システムとの連携
- 継続的な品質改善
VTuber 大空スバルさんのオタマトーン化プロジェクト
ホロライブVTuber大空スバルさんの音声をオタマトーン風に変換する楽しいWebアプリケーション。 ブラウザ上で動作し、リアルタイムで音声を楽器風に変換できます。 VTuberファンコミュニティとの交流から生まれたユニークなプロジェクトです。
機能
- リアルタイム音声変換
- オタマトーン風サウンド生成
- ブラウザベースで手軽に利用
- VTuberファン向けエンターテイメント
🎓 Academic Software
MMDAgent
オープンソースの音声対話システム開発ツールキット。3Dキャラクターエージェントとの マルチモーダル対話を実現するためのプラットフォームとして、国内外の研究機関で広く利用されています。
主な機能
- 音声認識・合成エンジン統合
- 3Dキャラクターアニメーション
- マルチモーダル対話制御
- プラグインアーキテクチャ
- クロスプラットフォーム対応
PRINTEPS Platform
実用的知的対話システム基盤(PRINTEPS)。ROS(Robot Operating System)と連携し、 実環境での音声対話システム展開を可能にする包括的なプラットフォームです。
技術仕様
- ROS連携アーキテクチャ
- クラウド・エッジ分散処理
- リアルタイム音声処理
- マイクロサービス設計
- スケーラブルなシステム構成
開発理念
研究成果の社会還元
学術研究で開発した音声処理技術を、実用的なソフトウェアとして一般ユーザーが 利用できる形で公開。研究と実用化の橋渡し役として活動しています。
オープンソース文化
多くのプロジェクトをオープンソースとして公開し、開発者コミュニティとの 協力を重視。技術の普及と発展に貢献することを目指しています。
ユーザー中心設計
ストリーマーや一般ユーザーの実際のニーズに基づいた機能設計。 フィードバックを重視し、継続的な改善を行っています。
コミュニティへの影響
🎮 ストリーミングコミュニティ
多数のTwitchストリーマーが音声認識・翻訳ツールを利用し、 国際的な配信活動をサポート
🔬 研究者コミュニティ
MMDAgentやPRINTEPSを活用した音声対話システム研究が 国内外の研究機関で進行
💻 開発者コミュニティ
GitHubでのオープンソースプロジェクトを通じて、 音声処理技術の普及と発展に貢献