技術解説

ドメイン駆動設計とは? その本質と初めからをゼロから解説

みなさまこんにちは、社内でアプリ開発を行っているおさかなです。 プロジェクトで開発しているときに「要件が複雑になってきた」「仕様変更が入るたびにコードが壊れそう」と感じることはないでしょうか? 私自身これまで機能追加を行う際は実装スピードを…

音声データの字幕化:MFAとLLMを組み合わせた字幕ファイル作成テクニック

みなさん、こんにちは。万次郎です。 前回の記事「音声の文字起こし、もっと楽に・高精度にできるかも?MFAの活用」では、Montreal Forced Aligner(以下、MFA)のセットアップ方法と基本的な使い方についてご紹介しました。まだご覧になっていない方は、先…

音声の文字起こし、もっと楽に・高精度にできるかも?MFAの活用

pre.code { / 行番号の基準をpreの左上にする / position: relative; / コードの左側を空ける / padding: .25em 0 0 3em; / 横スクロールバーを出して、コードが改行しないようにする / white-space: pre; overflow-x: scroll; } pre.code::before { / 行番…

ノードベースでのLLMアプリ開発 Difyのすすめ

皆さんこんにちは。ソニー・ミュージックエンタテインメントで生成AIの調査・検討を行っているみみずくです。 過去の記事(https://tech.sme.co.jp/entry/2023/10/31/200000)でも触れましたが、ChatGPTやClaudeなどの大規模言語モデル(LLM)は資料作成や情…

知識ゼロから始めるリファクタリング入門

リファクタリングとは 今日から始められるリファクタイング入門 1. 条件分岐によるネストを回避する 2. 不要なコード・意味の通じない命名の排除 3. nullを返さない、渡さない 4. staticメソッドは安易に使用しない 5. コレクション処理では重複コードを避け…

LLM時代の今、あえて学んでおきたいWord2Vec

皆さんこんにちは。ソニー・ミュージックエンタテインメントで生成AIの調査・検討を行っているみみずくです。 皆さんはコンピューター上で言語を処理するというと、どんな技術を想像するでしょうか。多くの方は、ChatGPTをはじめとする大規模言語モデル(LLM…

MVVMモデルとは? より効率的にシステムを開発するためのソフトウェアアーキテクチャについてご紹介

みなさまこんにちは、おさかなです。今回の記事では、ソフトウェアアーキテクチャのひとつであるMVVMモデルについて、その仕組みや考え方を、関連するMVCモデルも含めて紹介したいと思います。ソフトウェアアーキテクチャを意識することで、記述するコードが…

Stable Diffusionの中身はどうなっている? 内部処理をハンズオンで可視化

皆さんこんにちは。ソニー・ミュージックエンタテインメントで生成AIの調査・検討を行っているみみずくです。 2021年に画像生成AIモデルである「DALL-E」がOpenAIからリリースされて以来、時代は生成AIブームとも言われており、画像だけでなくテキストや音声…

JenkinsでCI環境構築して効率的な開発環境を実現する

※Jenkins®のロゴはJenkins Projectに帰属します。 あいさつ みなさまこんにちは、おさかなです。 現在所属しているチームでWindowsアプリを開発しているのですが、その中でJenkinsを使用してCI環境を構築する機会があったので、今回はCI/CDの紹介とその環境…

おまかせでマルウェアを検知してくれるって本当!? GuardDuty Malware Protection for S3 がリリースされたのでやってみた

こんにちは。ソニー・ミュージックエンタテインメント しんろくです。 アメリカ フィラデルフィアで開催されたAWS re:Inforce 2024 (現地 6/10-12)にて、待望のマネージド型脅威検出サービス「Amazon GuardDuty Malware Protection for Amazon S3」が発表…

新発見があるかも!? Spotify APIで、あるアーティストと類似性を持つアーティストを見つけだす

こんにちは。ソニー・ミュージックレーベルズの、ぎんです。 皆さんは、新しい音楽やアーティストをどのように探していますでしょうか? 音楽ストリーミングサービスの普及により、新旧問わず膨大な数の曲にアクセスできるようになり、一つのプラットフォー…

【ハンズオン】Vision APIを使ってイベント来訪者の笑顔から満足度を測定する仕組みを作ってみた

皆さまこんにちは。ソニー・ミュージックエンタテインメントで生成AIの調査・検討を行っているみみずくです。 昨今、画像認識ができるAIは多くの場面で利用されています。たとえば、事故防止のために標識を認識して自動車のディスプレイに表示するシステムや…

音声フォーマットの違い ~VorbisとMP3の音質を実際にデータで比べてみた~

皆さまこんにちは。ソニー・ミュージックエンタテインメントで生成AIの調査・検討 を行っている みみずくです。 生成AIといえば画像生成や文章生成のイメージが強いですが、ここ1、2年で音楽を生成するAIも盛り上がりつつあります。そこで今回は、知っておく…

大規模言語モデル(LLM)にできること・できないこと

みなさま、こんにちは。 ソニー・ミュージックエンタテインメントでAI関連技術の調査・検討をしているみみずくと申します。 我々のチームでは、人工知能(AI)・機械学習(ML)をエンタメの創出に活用すべく、調査・検討を行っています。 さて、昨今巷を賑わ…