AIを社会に直接応用する人たちからの「啓示」

AIを社会に直接応用する人たちからの「啓示」

AI を自然言語処理に適用することは、これまでも、そして現在も世界中で発展の傾向にあり、人々のコミュニケーション言語の違いによって生じるギャップを解消するのに役立っています。世界をリードする携帯電話の開発・製造業者の1つであるサムスンは、初のGalaxy AI携帯電話シリーズにAI機能を開発・搭載することで、このトレンドに追いついた。コミュニケーションの際の言語の壁はもうありません。Galaxy AI の通話翻訳機能は最大 13 言語の翻訳をサポートしており、SRV は Galaxy AI におけるベトナム語の研究開発の R&D センターであることを誇りに思っています。

SRV エンジニアリング チームのベトナム語での Galaxy AI 研究開発プロジェクトの AI 機能への貢献には、音声認識と音声からテキストへの変換における AI アプリケーションが含まれます。 Galaxy AI デバイスは、自動音声認識によってユーザーが使用している言語を自動で認識し、音声内容 (Speech) をテキスト (Text) に変換して、次の処理の入力データとして使用します。オンデバイスでは、データはデバイス上で完全にプライベートに保たれます。 AI を適用して、ソース言語からターゲット言語に翻訳します。入力データは上記の ASR 自動音声認識モジュールからのもので、出力はターゲット言語(ターゲット言語、つまりユーザーが翻訳したい言語)に翻訳されたテキストデータです。 AIを使用してテキストを音声に変換します。入力はテキスト(翻訳済み)であり、出力はそのテキストから読み取られた音声です。

2023年、Samsungが写真編集アプリケーションに初めてGenerative AIの適用を導入したことで、SRVのエンジニアリングチームは、モバイル写真編集ソフトウェア(フォトエディター)の多くのスマート機能の開発と完成に重要な役割を果たしました。たとえば、写真内のオブジェクトを別の位置に移動する(デバイスは画像内のオブジェクトを自動的に分析、削除、再配置し、オブジェクトを削除した後に画像の欠落部分を再作成します)。画像の拡大(デバイスは、サイズを変更するときに画像部分を再現し、レイアウトを調整し、欠落した背景部分を完全に埋め、コンテンツが元の画像の境界を超えても、画像の表示領域を拡大します)。画像の解像度を高めます (品質を低下させることなく画像の解像度を向上させます)。

このプロジェクトについて、サムスンベトナム研究開発センターの言語AI研究グループ責任者であるエンジニアのトラン・トゥアン・ミン氏は次のように述べています。2023年10月、Galaxy AI人工知能システムがGalaxy S24電話シリーズ向けに開発されており、当初の計画では英語、中国語、フランス語など、世界で人気の言語が対象となっていました。サムスングループの経営陣は、ギャラクシーAIにベトナム語を追加することを決定した。これまでにユーザー数と世界での人気度に基づいて選択された言語と比較すると、ベトナム語のユーザー数は少なくなっています。これは、ベトナムが重要な市場であり、サムスンの開発計画において戦略的な位置を占めていることを示しています。サムスンベトナム研究開発センター(SRV)は、同グループから信頼され、Galaxy AIにおけるベトナム語の研究開発の任務を任されたことを誇りに思っています。

SRV は、この任務を受けてすぐに、さまざまな部門から機械学習、ディープラーニング、自然言語処理の経験者を集め、言語 AI 研究グループを設立しました。

「SRVがAI関連の戦略的プロジェクトを受注したのはこれが初めてだったので、AIチームに選ばれたときの喜びは今でも覚えています。さらに特別なことは、今や最も近代的な電話回線であるS24スマートフォンで、母国語であるベトナム語を開発できたことを非常に誇りに思うことです。SRVのリーダーシップは、AIをサムスングループだけでなくSRVの研究開発の焦点と位置付けていました。そのため、AIチームには、露出、学習、迅速な技術移転という最高の条件が与えられました。AI研究開発チームのエンジニアは、AIモデルアーキテクチャ、AI用アルゴリズム、AIトレーニング、AI用データに関する移転を受けるため、韓国とインドに派遣されました。さらに、AIテスト部門は、AIに関する知識、テスト方法、テストサポートツール、AIテストの経験を共有するために直接韓国に派遣されました。

さらに、高品質の AI を開発するには、大規模で多様かつ管理されたデータ ソースが前提条件となります。英語、中国語など世界で人気の言語のデータと比較すると、ベトナム語のデータソースははるかに少ないです。これが私たちが直面している最大の課題です。さらに、「嵐はベトナム語の文法ほど悪くない」と言われるほどベトナム語の文法は非常に難しい問題であるだけでなく、方言、俗語、同義語、借用語、GenZ世代の新語などにも関わる多くの困難に直面しました。これらの問題を解決するために、SRVはAIのデータ処理に何百人もの人材を動員しなければなりませんでした。 AI をトレーニングし、AI が理解して正確な出力を得られるよう、継続的にデータを生成しなければなりません。特に、これらのデータ ソースは法的に安全でなければならず、単に自由に収集されたデータであってはなりません。

プロジェクトへの集中度が高く、大量のリソースが動員されたおかげで、非常に短い時間で、既存のデータを調整し、AI トレーニングに役立つ大量の新しいデータを作成することができました。たとえば、Galaxy S24 シリーズをベトナムの人々にとってよりスマートなものにするために、何百万もの男性と女性の音声ファイルを録音しました。

テストに関しては、正確な翻訳とさまざまな騒音環境での音声認識を保証するために、ラボ環境でテストを実施するだけでなく、ホアンキエム湖、ショッピングモール、カフェなど多くの場所に行き、実際のユーザー環境でAI機能が適切に動作することを確認しています」とエンジニアのトラン・トゥアン・ミン氏は語った。

また、エンジニアのトラン・トゥアン・ミン氏によると、彼らのたゆまぬ努力のおかげで、SRV のエンジニアはわずか 4 か月でゼロから技術を習得し、S24 製品ライン向けのベトナム語向け AI を完成させたとのことです。

優れたコア技術には、音声入力とテキスト出力の自動音声認識などがあります。これは、Galaxy AI で最も難しい部分です。これは、機械に人間の言語を理解させることに似ています。英語-ベトナム語と韓国語-ベトナム語の 2 つの言語ペアをサポートする翻訳。テキスト読み上げ

「研究チームのエンジニアと同様に、テスト部門のエンジニアも今ではすべてのAI機能のテストプロセス全体を担えるようになりました。そして、企業からの指導とトレーニングを受ける立場から、テスト部門は仕事を習得し、テストプロセスと経験を東南アジア諸国に伝える役割を担っています」と、エンジニアのトラン・トゥアン・ミン氏は誇らしげに語りました。

ソフトウェア開発部門ディレクターのド・ドゥック・ドゥン氏は次のように語っています。「ギャラクシーAIは、ベトナムのエンジニアが参加した最初のグローバルプロジェクトではありません。以前は、現在のサムスンベトナム研究開発センターの前身であるサムスンベトナムモバイル研究開発センター(SVMC)でグローバルプロジェクトに参加していました。SVMCは2012年に設立され、ハノイのPVIビルにありました。この名前によると、当時は携帯電話向けの技術ソフトウェアソリューションの開発にのみ焦点を当てていましたが、サムスンベトナム研究開発センターにより、モバイルデバイスだけでなく、ノートPCや通信機器にも事業領域が拡大しました。これは、サムスンベトナム研究開発センターの継続的な成長を示しています。」

また、ド・ドゥック・ドゥン氏によれば、技術移転に関しては、担当分野ごとに毎年、韓国だけでなく世界中のサムスンR&D部門から技術移転を受けているとのこと。そして昨年以来、サムスンは、グループの最先端かつ最重要技術であるAIをベトナムに移転することで、ベトナムを生産拠点としての役割を超えて、サムスンの世界的な戦略的な研究開発拠点にすることを決定した際の政府との約束を守っている。

「また、サービス需要の増加に伴い新技術の開発も進んでいますが、新技術の開発は最終的には基礎技術のサポートがあってこそ実現できます。SRVは現在、製品開発中心のR&Dから専門性の高い深掘りR&Dへの変革を目指しています。そして2022年からは、ソフトウェア分野ではマルチメディアとセキュリティの2つを深掘り研究の重点分野として選び、人材育成に力を入れています。また、ノートPCと通信機器の2つの分野でハードウェア分野の開発規模が拡大した際には、ハードウェア設計の専門能力を向上させるためのトレーニングにも力を入れていきます」とド・ドゥック・ズン氏はさらに語った。

<<:  4月11日の朝、米ドル価格は再び上昇した。

>>:  グリーン経済開発 - 港湾都市に新たな市場を開拓する鍵

推薦する

自宅のスペースに最適なソファのサイズの選び方

部屋を美しく見せるためには、ソファが部屋の空間と調和している必要があります。スタイルと色に加えて、住...

香港研究センター(中国)が脳手術を支援するAIを発表

中国科学院香港支部人工知能ロボットセンター(CAIR)は3月11日、脳神経外科医がより効率的な臨床診...

4つの簡単なステップでより美しく科学的なワードローブを実現

美しく、きちんと整ったワードローブを整理し、デザインすることは、今日の多くの女性にとって難しい問題で...

火山の溶岩蒸気で焼いたユニークなピザ

グアテマラのピカヤ火山は2月から再び噴火しており、溶岩が1キロ以上流れている。火山活動は多くの人々を...

男性、たった1日でCOVID-19ワクチン接種10回

ニュージーランド保健当局は、1日に10回分のCOVID-19ワクチン接種を受けた男性に対する調査を開...

Samsung の携帯電話のメモリをクリアする 6 つの簡単な方法の説明

Samsung の携帯電話のメモリがいっぱいになると、それ以上アプリケーションをインストールしたりデ...

学生がストーブでロケット燃料を作り、22人が自宅からの避難を余儀なくされる

ガーディアン紙(英国)は、事件は2月20日に米国ユタ州のブリガム・ヤング大学で発生したと報じた。ブリ...

目を引く黄色のiPhone 14の実物写真が公開

Appleは、ユーザーの購入を促進するために、スーパー製品であるiPhone 14に、非常に明るく目...

専門家が世界で最も恐ろしい死の笛の音を再現

彼らは、1999年にメキシコで発見された骸骨に付いていたオリジナルの頭蓋骨型のデザインを基に、3Dプ...

LG OLEDテレビのアクティブHDRテクノロジーについて学ぶ

LG OLED テレビが、なぜ近所のテレビよりも優れた画質とよりリアルな画像を実現しているのか疑問に...

ソニーの携帯電話を買って使うべきでしょうか?

長い停滞期間を経て、ソニーの携帯電話は最近市場に戻り、非常に美しいデザインと非常に印象的なサポート技...

Apple Watch Series 9が399ドルから発売

予想通り、最近のWonderlustイベントで、Appleはユーザーに新製品を紹介しました。イベント...

オンパゴダ祭り:民族コミュニティ間の文化交流の美しさ

オンパゴダ祭りで神々を迎える儀式。国際代表団がフェスティバルに参加する過程で、ドンナイ省の機能機関は...

アジアはEUのAI管理強化法案にあまり関心がない

しかし、関係筋によると、アジア諸国政府はこうした欧州の説得努力にあまり関心がないという。 EUとその...

ベトナムが英国最大の食品・飲料フェアに参加

フェアでベトナム製品を紹介するブース。写真:フォン・ハ/VNA英国特派員英国最大の年次国際食品・飲料...