特許情報:音声

  (部署略号:音=音声)
「2013年3月31日現在」 
部署 出願日 出願番号 出願件名 登録日 登録番号 管理番号 概要 共有 特許公報
2002.9.11 2002-
265510
音声認識装置およびプログラム 2007.3.30 3936266 20021017 In current HMM based speech recognition systems, it is difficult to supplement acoustic spectum features with additional information. On the other hand, Baysian Networks (BN) allow for easy combination of different continuous as well as discrete features by exploring conditional dependencies between them. However, the lack of efficient algorithms has limited their application in continuous speech recognition. Here, we propose new acoustic model, where HMM are used for modeling of temporal speech characteristics and state probability model is represented by BN. JPB_0003936266.pdf
2002.9.20 2002-
275886
マイクロホンアレーにおけるマイクロホン受信信号の補正方法および補正装置 2007.3.16 3929863 20021007 モバイル機器でのマイクロホンアレーの利用は、各マイクロホン素子の空間的な位置が時々刻々と変化するため、音源方向が固定されていたとしても適応ビームフォーミングを行う必要があったが、本発明では、マイクロホンアレーに対する音源方向を一定に保つことにより、固定ビームフォーミングの利用が可能となり、マイクロホンアレーのシステム設計を簡単化できる。 JPB_0003929863.pdf
2002/2/22 2002-
047047
言語モデルの適応化方法 2006.9.8 3850742 20011010 音声翻訳器の利用範囲(タスク)を広げる際に伴う言語モデルの利用範囲を広げる際に、別の言語で書かれた新たなダスクでのモノリンガルコーパスを翻訳し、その翻訳されたデ一夕を使ってその新たなタスクに対して言語モデルを適応化させ、そのタスクに対して単語予測力とカバレッジの点で効果的な言語モデルを作成する方法および装置。 JPB_0003850742.pdf
2002/8/23 2002-
243908
統計的機械翻訳方法 2007/8/31 4006297 20021005 デコーディングアルゴリズムにおける翻訳の生成方向を右から左に、文末から生成することにし、英日翻訳のように、日本語が文末に文のならびかえの制約が強い場合、文末から生成することにより、効果が得られる。 JPB_0004006297.pdf
2003.10.23 2003-
363900
モデル構造作成装置、音声認識装置、及びモデル構造作成プログラム 2009/4/24 4299630 20031019 音声認識用音響モデルにおいて、モデル状態共有構造を獲得するための方法であるML-SSSにおいては、分割停止条件として何らかの制限を人手で与える必要があったところ、改善策として、分割状態選択条件および停止条件にモデル構造をより厳格に反映できる変分ベイズ法による規準を用いることにより、自動的に学習データを反映させたよりよいモデル構造が得られるものである。 JPB_0004299630.pdf
2003.12.1 2003-
401706
ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム 2008/9/26 4191021 20031027 We propose a novel OOD (out-of-domain) detection framework to reject utterances that cannot be handled by the back-end of a spoken language system. The proposed approach makes use of classification confidence scores of multiple topics and trains a linear discriminant in-domain verifier using GPD (gradient probabilistic descent). Training is based on deleted interpolation of the in-domain data, and thus does not require actual OOD data, providing high portability. JPB_0004191021.pdf
2003.4.14 2003-
108676
節境界検出装置、機械翻訳装置及びコンピュータプログラム 2007.3.2 3924260 20021024 日本語文の形態素列から「節」の境界を検出し、その節の種類を自動的に判定するものであり、構文的に意味のある144種の節境界を、361個の規則により判定し、結果的に、性質の異なる複数のコーパスに対して、96-99%という高い正解率を得た。この検出結果は、文分割、同時通訳、局所的な構文解析、要約などの処理に応用することを可能にしている。 JPB_0003924260.pdf
2003.7.25 2003-
280402
知覚試験用音声データセット作成装置、コンピュータプログラム、音声合成用サブコスト関数の最適化装置、及び音声合成装置 2006.11.17 3881970 20031010 波形接続型音声合成において、知覚特性を反映したコスト関数を用いて波形素片を選択することで、より自然性の高い音声を合成できると期待されるところ、コスト関数は様々な要因に対応する複数のサブコスト関数から構成されるが、すべてのサブコスト関数に対して知覚的評価に基づく最適化を行うものである。 JPB_0003881970.pdf
2003.8.21 2003-
297306
声質差評価テーブル作成装置、音声コーパスの声質差評価テーブル作成システム、及び音声合成システム 2006.11.17 3881971 20031005 音声素片接続型音声合成では、大規模な音声コーパスを使用するため、異なる時期に録音された声質の異なる音声が同一コーパス中に混在し、声質の異なる音声素片を接続すると音質劣化が生じるが、その音質劣化を軽減するために、あらかじめ聴取実験を行って録音日間の声質差をスコア化して記録しておき、音声素片選択時に声質の異なる音声素片が選択されることを防止するために利用するものである。 JPB_0003881971.pdf
2003.8.28 2003-
304965
翻訳エージェントの翻訳能力評価方法 2008/4/18 4113814 20031018 DPマッチングで翻訳正解率を計算する場合、正解として日英方向であるならば入力の日本語の対訳文を利用するが、翻訳では多様な表現があるので、正解であったとしても翻訳正解率は劣化する問題があったところ、本発明は、大量の対訳コーパスから類似表現を検索し正解英文を追加することにより、表現の多様性を許容し、劣化問題を緩和するものである。 JPB_0004113814.pdf
2003.8.29 2003-
307240
機械翻訳文の評価方法、および機械翻訳文の評価装置 2007.3.30 3936687 20031012 本発明は、評価対象の翻訳出力を、複数の逆方向の翻訳システムで再度翻訳し、翻訳システムへの入力と、逆翻訳の結果を比較することにより評価するものであり、原言語側での評価を可能にするため、目的言語側の知識を持たないユーザでも評価することが可能になる。また、翻訳自動評価へ応用することにより、リアルタイムでの評価も可能になる。 JPB_0003936687.pdf
2003.8.6 2003-
288293
音声の周波数特性の等化装置 2006.10.20 3869823 20031008 波形素片接続型音声合成システムは、音質向上のために大規模な音声コーパスを使用しており、その録音には数ヶ月~数年の期間を要し、録音時期が異なることで、録音系の特性変化によって音質が変化することがあるところ、本発明は、録音系の伝達特性の変化を、パワースペクトル密度にもとづくフィルターを用い、人間の聴覚特性を考慮しつつ補正できるようにしたものである。 JPB_0003869823.pdf
2003.9.16 2003-
322553
音声合成装置及びそのためのコスト計算装置、並びにコンピュータプログラム 2006.9.15 3854593 20031013 選択接続型音声合成において、選択に用いる選択尺度の計算方法を、選択時に動的に変化させることによって、それぞれの区間ごとに知覚的に影響の大きい誤差が生じることを抑制し、もって合成音声の品質を向上させるものである。 JPB_0003854593.pdf
2004.10.26 2004-
310550
教材提示順序制御装置及び同制御プログラム 2010/7/16 4550548 20041032 語学教育では、学習者のモチベーションを維持するために、教材の提示順序を制御する必要があるが、本発明は、教材間の関連度を例えば、語彙的知識とタニモト係数のような尺度によって計算し、この関連度に基づく適切な順序で教材・問題を提示するものである。 JPB_0004550548.pdf
2004.10.26 2004-
310551
問題自動作成装置および問題自動作成プログラム 2011/1/7 4659433 20041031 本発明は、コーパスから多肢選択問題を自動的に作成する装置に関し、コーパスは(1)文(または単語)と(2)その関連情報(文、文章、画像等)の対応からなり、この対応を乱すことによって多肢選択問題を構成するものである。この際、表現の同義性と類似性を活用する。さらに、(1)に付随したまたはこれに基づいた合成音を使うことによって、リスニング問題の自動作成も可能になる。 JPB_0004659433.pdf
2004.11.1 2004-
318208
音素単位セットを最適化する方法及びシステム
(Method and system for optimizing a phonemic unit set)
2010/11/26 4631076 20041034 The problem dealt in this study is the optimization of the basic phoneme set used in an automatic speech recognition system. The current status about this issue is like one of the followings :
1) An widely accepted phoneme set is used in all kinds of LVCSR system for that language. 2)Try several heuristically determined phoneme set and select one based on the ASR recognition perrformance. 3)In some small vocabulary task, use words as the basic units.
We proposed an optimal design of a phoneme set for a specific ASR task: task dependent phoneme set design. The basic idea is that if a deletion of one phoneme from a large phoneme set do not decrease the linguistic discrimination too much, it may be deleted in order to reduce the phoneme set. The theoretical method adopted for this is Maximum Mutual Information Criterion based Phoneme set design. And the first application is to design one phoneme set for Chinese.
JPB_0004631076.pdf
2004.2.23 2004-
045855
F0輪郭を合成する方法及びコンピュータプログラム 2008/11/28 4223416 20031025 Chinese is a tone language, the tone and intonation are all manifested in the fundamental frequency (F0) contours. Synthesis of the tone and intonation patterns is necessary for building a Chinese text-to-speech system.Existing methods are not sufficient for synthesis of natural Chinese tone and intonation patterns due to the large tone and intonation variations in speech.In this work, we shrink an F0 contour into its underlying peaks and valleys (pitch targets), which can represent the essential features of the tone and intonation patterns. Analysis and processing are then focused on the pitch targets. The exact shape of the F0 contour can be recovered back using a functional model, given the peaks and valleys. JPB_0004223416.pdf
2004.3.12 2004-
070209
翻訳能力推定装置、翻訳能力推定方法および翻訳能力推定プログラム 2010/7/30 4559756 20031057 本発明は、翻訳能力の推定に関し、相関の高い順に翻訳評価文を提示し、推定誤差が所望の誤差未満になった時点または推定誤差の最小値を検出した時点で、翻訳能力値を推定するので、すべての翻訳評価文を用いることなく、ほぼ正確な翻訳能力を判断することができるものである。 JPB_0004559756.pdf
2004.3.16 2004-
075185
素片接続型音声合成装置及び方法 2009/12/18 4424024 20031059 本発明は、音声合成に関し、出現頻度の高い素片波形から優先的にアクセスが高速な記憶装置に蓄え、音声合成時には、低速な記憶装置に蓄えられた素片に対して、コスト計算においてある程度のペナルティを与え、高速にアクセスできる素片がより選択されるようにすることで、波形素片のアクセス速度を平均的に速くするものである。このペナルティの値は、速度と品質の関係から定める。 JPB_0004424024.pdf
2004.3.16 2004-
073977
素片接続型音声合成装置及び方法 2010/9/17 4586386 20031058 本発明は、素片接続型音声合成に関し、予備選択基準とする予備選択コスト関数に含まれるサブコストを増やしながら候補数を絞り込んで行くことを繰り返すことで、効率的な素片選択を実現するものである。特に、前段におけるコスト計算結果を次段のコスト計算に用いることができるようにコスト関数を設計することで、高速な素片選択が実現できる。 JPB_0004586386.pdf
2004.3.16 2004-
074594
中国語の声調分類装置及び中国語のF0生成装置
(Chinese Language Tone Classification Apparatus and Chinese Language F0 Generating Apparatus)
2010/10/29 4617092 20031037 There are substantial F0 variations in tonal F0 contours in Chinese continous speech. This make it very difficult to discriminate robustly the tonalities either by human labelers or by automatic tone recognizers. We proposed in this paper that anchoring based hypothesis is a theory that can consistently account for the discrimination of the tones subject to contextual F0 variations such as downstep lowering effects and contextual assimilation effects. If correct, this theory will improve significantly human understanding of tone language. Statistical distributional analyses and tone recognition results serve as partial sound evidences of our suggestion. JPB_0004617092.pdf
2004.3.30 2004-
101094
発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ 2010/6/4 4521673 20031062 特徴パラメーターとして利用する正規化した音声パワーのその正規化に際し、発話終了まで待って、最大パワーを算出する必要があり、これはリアルタイム処理には使用できないところ、本発明は、音声パワーのダイナミックレンジをリアルタイムに更新することにより、擬似的ではあるが、音声パワーをリアルタイムに正規化することができるようにしたものである。 JPB_0004521673.pdf
2004.3.30 2004-
098152
汎用GUI装置及び汎用GUIプログラム 2011/4/8 4715104 20031063 プログラムのオプション値やパラメータ値をGUIで設定する場合、各プログラム毎にGUIを設計し実装する必要があるが、本発明は、プログラムのオプションやパラメータを統一的にプログラム中に記述し、GUIがその情報を動的にプログラムから取得することにより、様々なプログラムのGUI環境を1つの汎用的なGUIシステムとすることができ、プログラムの追加や更新の影響を受けないようにしたものである。 JPB_0004715104.pdf
2004.3.31 2004-
104090
データ処理システム設計装置及びそのためのコンピュータプログラム 2011/3/4 4691895 20031060 本発明は、データ処理に関し、Webブラウザ上で、実行可能なプログラムモジュールの中から必要なモジュールを選択し、モジュール間のデータの流れに応じて線で結ぶことにより、システムを実行するものである。 JPB_0004691895.pdf
2004.3.31 2004-
104088
汎用入力データ検査装置及びプログラム 2011/11/4 4854058 20031064 オプションやパラメータの妥当性チェックは、作成やテストに工数がかかり、またその品質はプログラマの技量に大きく依存するところ、本発明は、システム全体の品質と生産性を高めるためにオプションやパラメータの制約を統一的に記述し、それを元に妥当性のチェックを行う汎用的なライブラリサービスに構成したものである。 JPB_0004854058.pdf
2004.5.21 2004-
151966
機械翻訳システム、その制御装置、及びコンピュータプログラム 2007.2.23 3919771 20031046 本発明は、自然言語の原文aを別の自然言語の訳文bに翻訳するものであって、①aの訳文候補xを生成する。②xをより良い訳文yに改善する。③終了条件を満たせば、yをbとして出力するか、さもなくば①②③のステップを繰り返すものである。 JPB_0003919771.pdf
2004.7.29 2004-
221450
多肢選択言語試験問題自動作成装置およびコンピュータプログラム 2007/9/28 4018673 20041012 本発明は、コーパス中の表現を変形して、問題と選択肢の組からなるテストを作成するものであり、一例的には、①コーパスから文を選び空所の位置を決める。②その空所に相当する正解の選択肢に類似した不正解の選択肢の候補を生成する。③選択肢の候補の妥当性を検査して、文と見做せないものだけ残す。④問題の形式で出力する。というような空所問題を構成するものである。 JPB_0004018673.pdf
2004.8.13 10/917420 Machine Translation Apparaus and Machine Translation Computer Program 2011/4/12 米国7925493 20031034 本発明は、機械翻訳に関し、原文Jの訳文Eを試作し、JとEの対応を評価し、スコアSを得、Eに可能な変形(訳語や語順の変更)を施してJとの対応を評価し、最良の変形訳とスコアをEとSとして、スコアの改善がなくなるまで、繰り返すものである。
2004.8.9 2004-
232297
音声素片選択装置および音声合成装置 2010/5/21 4512846 20041009 素片選択型音声合成において、従来は1文の先頭から最後までについて様々な可能性を考慮し、その中での最適解を得ていたため、合成器に1文全てに対応する指令が入力されるまでは、音声を出力出来なかったが、本発明は、探索木構造において、その時刻での最適枝を逆に辿り、根の直下の素片を早期に確定させ、それを新たな根とする、という処理を繰り返すことにより、1文全ての入力が終わるより早く、音声を出力することを可能にしたものである。 JPB_0004512846.pdf
2004.9.16 2004-
270307
音声合成方法及び音声合成プログラム 2012/04/06 4963345 20031039 音声合成であって、音声素片間の間の接続箇所に連続的な移行部を生成することによって接続に伴う知覚的な不連続感を低減するものである。 JPB_0004963345.pdf
2004.9.9 2004-
10077038.5
複数の訳文候補を改良して訳文を生成し最良訳を選択する機械翻訳システム 2010/4/28 中国ZL2004
10077038.5
20031035 本発明は、自然言語の原文aを別の自然言語の訳文bに翻訳するものであって、①aの訳文候補xを生成する。 ②xをより良い訳文yに改善する。 ③終了条件を満たせば、yをbとして出力するが、さもなくばこれら①②③のステップを繰り返すものである。
2005.3.1 2005-
056592
モーションキャプチャデータ補正装置、マルチモーダルコーパス作成システム、画像合成装置、及びコンピュータプログラム 2009/10/2 4379616 20041029 本発明は、顔器官についての正確な位置データが得られるモーションキャプチャデータ補正装置及びマルチモーダルコーパス作成システムに関するものである。 JPB_0004379616.pdf
2005.3.30 2005-
098067
イントネーションの変化の特徴を声調の変形により表す方法及びそのコンピュータプログラム
A method of characterizing intonation variations with tone transformation and a computer program therof
2011/8/5 4793776 20041030 This paper describes a novel method for separating actual intonation from lexical tones manifested in fundamental frequency (F0) contours. This capability is crucial in the next generation of conversation systems that must recognize and synthesize intonation variations for different speech acts and emotions. This method characterizes intonation variations in a parameter by transforming F0 contours to the simpler components of intonation, such as the four lexical tones in Mandarin that can be fixed at appropriate values for individual speakers.We specify the method by an algorithm that calculates intonation variations and test it by analyzing Mandarin speech samples. JPB_0004793776.pdf
2005.5.16 2005-
143289
適応フィルタ
Adaptive filter
2010/9/10 4581114 20051001 We present a multiple-input multiple-output (MIMO) adaptive filter and adap-tive algorithm for application in adaptive beamforming and in joint adaptive beamforming and acoustic echo cancellation. The MIMO adaptive filter con-sists of a matrix of adaptive filter coefficients and a module for adaptively up-dating the coefficient matrix to minimize error signals using a predetermined optimization criterion exploiting the statistics of the error signals. The error signals advantageously have a non-Gaussian probability ensity distribution to provide robustness in the adaptive algorithm against outliers. The adaptation of the adaptive filters is advantageously done in the frequency-domain so that each frequency bin can be adapted separately. JPB_0004581114.pdf
2005.7.28 2005-
218476
頭部動作自動生成のための頭部動作学習装置及び頭部動作合成装置並びにコンピュータプログラム 2010/10/8 4599606 20051005 本発明は、音声に同期した頭部動作を自動生成するものであって、音声と頭部動作を同時収録したデータを元に、音声特徴量(入力)、音声の感情強度(入力)、頭部動作(出力)の関係をニューラルネットワークで学習し、新規の音声に対して、音声特徴量を算出後、それに対する頭部動作をニューラルネットワークを用いて合成するものである。入力特徴量の感情強度パラメータを変更することで、合成される頭部動作の感情表現の強さを制御することができる。 JPB_0004599606.pdf
2005.8.19 2005-
238236
音声認識結果の検査装置及びコンピュータプログラム 2011/6/10 4756499 20041050 本発明は、音声翻訳装置において、トータルの音声翻訳性能が高くなるように音声認識処理に信頼度を付与し翻訳部に引き渡すための音声認識信頼度評価装置に関する。具体的には、翻訳処理で用いられるフレーズ情報を信頼度計算に利用し、信頼度を高める手法である。 JPB_0004756499.pdf
2005.9.16 2005-
269624
音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム 2010/11/12 4621936 20051020 音声合成システムによる合成音の自然性の向上には、適切なポーズ位置の推定が重要である。
本発明は、 Naive Markov Modelという新たな統計モデルを導入することで、入力テキスト全体でのポーズ数およびポーズ位置のバランスを考慮しながら、非常に低計算コストで精度良くポーズ位置を推定することができるものである。
JPB_0004621936.pdf
2005.9.2 2005-
254424
音響モデル生成装置、およびプログラム 2011/1/7 4654452 20051002 We propose an acoustic model training technique which is robust against outliers such as clipping, unexpected noise, poorly pronounced word segments, or mis-transcriptions, which deteriorate the quality of the acoustic models and in turn decrease speech recognition performance.The outlier-robust acoustic model training technique is
based on a maximum likelihood (ML) criterion and automatically detects and removes outliers from the training data.
JPB_0004654452.pdf
2006.3.3 2006-
057304
素片接続型音声合成装置及びコンピュータプログラム 2009/4/10 4292191 20051032 本発明は、素片接続型音声合成において、素片データベースから取り出す素片候補の数を、事前実験の結果を用いて構築した回帰木を用いて決定することにより、素片選択において考慮する素片候補数を減らし、従来と同等の品質の音声をより短時間で生成することができるものである。 JPB_0004292191.pdf
2006.5.2 2006-
128110
アニメーション作成装置 2010/11/26 4631077 20061001 本発明は、Computer Graphicsによって作られたキャラクタと声優さんの声とを同期して自動的に発話アニメーションを生成するインタラクティブ発話合成システムである。 JPB_0004631077.pdf
2006.6.2 2006-
154497
自然言語における多義解消装置及びコンピュータプログラム 2012/12/07 5146979 20061002 本発明は、多義解消装置に関し、単語Wの意味候補集合{Si|i:1-N}に対して、ウェブから取得した事例に基づいて、あり得ない意味候補を棄却する、または、最も的確な意味候補を選択するものである。 JPB_0005146979.pdf
2006.7.24 2006-
201026
リップシンクアニメーション作成用の統計確率モデル作成装置、パラメータ系列合成装置、リップシンクアニメーション作成システム、及びコンピュータプログラム 2010/11/26 4631078 20061003 アニメーション生成装置から出力された顔器官移動量の軌跡をなめらかにすることで、実際の発話に近い、自然な発話アニメーションを生成可能とされている。具体的には、静的特徴量(顔器官の移動量)のみを使用していた。
本発明は、動的特徴量(速度、加速度)を導入し学習し、学習結果をもとに任意の音声から発話アニメーションを決定するものである。
JPB_0004631078.pdf
2006.8.28 2006-
230543
アニメーションデータ作成装置及びアニメーションデータ作成プログラム 2010/7/9 4543263 20061005 本発明は、素片接続による、任意の音声からの発話動画像生成に関し、予め複数文章を読み上げた音声のデータベースを用意し、このデータベースには視覚素およびその継続長、パワーをラベル付けされており、任意の音声の発話動画像を生成する場合、視覚素毎に、データベースの情報からもっとも適したデータを獲得してこれらを組み合わせ、一つの動画像を生成するものである。 JPB_0004543263.pdf
2007.3.9 2007-
061107
音響空間共有装置 2011/12/2 4873316 20061011 本発明は、複数の利用者が音響空間を共有しながら、他者とコミュニケーションを交わすことを可能とする音場通信システムに関し、共有音場として利用する音響空間データをデータベースに保存しておくこと、利用者は様々な音響空間を体験しながら他者とコミュニケーションを交わすことが可能となるものである。 JPB_0004873316.pdf
2007.5.25 2007-
139634
雑音抑圧装置、コンピュータプログラム、及び音声認識システム 2012/08/31 5070591 20061006 パーティクルフィルタを用いた雑音除去において、パーティクルフィルタにより背景雑音をフレーム毎に計算し、雑音除去するために必要な雑音重畳音声 GMM を(背景雑音の推定と同様にフレーム毎に)計算していた。
本発明は、雑音重畳音声 GMM の更新間隔を調節することにより、音声認識性能の劣化を抑えつつ、かつ高速な雑音除去を実現するものである。
JPB_0005070591.pdf
2007.7.10 2007-
180505
リップシンクアニメーション作成装置、コンピュータプログラム及び顔モデル生成装置 2010/11/5 4617500 20061013 本発明は、視覚素の部分集合から口形状アニメーションを生成するものであって、事前に対象となる言語の音素と視覚素の関係を標準モデル内で構築・正規化し、アニメーション製作時には、視覚素の部分集合のみを準備し、標準モデルにて正規化された視覚素との対応を指定することで、残りの対応の取れていない視覚素を対応の取れた視覚素部分集合の重み付き線形和として表現する重みを推定し、音素-視覚素変換系を補完するものである。 JPB_0004617500.pdf
2007/12/25 2007-
332427
木構造辞書を記録した記憶媒体、木構造辞書作成装置、及び木構造辞書作成プログラム 2012/11/2 5120749 20071007 本発明は、木構造辞書に関し、未知語集合をクラスカテゴリ毎に分類し、同じクラスカテゴリに分類した未知語集合に対して、既存の認識辞書の同じクラスカテゴリの単語の1つに未知語を割り当てることにより、未知語に対するn-gram確率を割り当てるものである。 JPB_0005120749.pdf
2007/9/10 2007-
233825
読み付与装置、およびプログラム 2013/03/29 5229448 20071002 音声認識や音声合成や機械翻訳などのシステムには、単語の読み情報が不可欠である。読みは辞書という形でシステムに組み込まれる。しかし、通常、固有名詞を初めとして、辞書に記載されていない単語がたくさんあり、処理の失敗の原因となっているという課題がある。
本発明は、読みの付与装置であって、入力単語の読み候補を辞書を参照して列挙するとともに各読み候補にWEBを利用して尤もらしさを付与し、この付与作業を入力単語を分割して行うようにしたものである。
2007/9/12 2007-
236561
軌道探索装置 2012/11/30 5141876 20071004 本発明は、機械に参照点に依存した空間的移動の概念を学習させた後で、学習した概念を用いて行動系列を計画するものである。概念の学習では、参照点が非観測である動画像情報から、「ちかづく」「のせる」等の空間的移動を表す確率モデルを隠れマルコフモデルを用いて学習し、次の動作の生成では、ユーザが与えた目標点への軌道を、学習した概念の系列としてユーザに呈示すると同時に、確率モデルを座標変換し、最尤軌道を生成するのである。 JPB_0005141876.pdf
2008/10/24 2008-
273704
台詞音声作成装置、発話音声収録装置、およびコンピュータプログラム 2012/11/22 5137031 20081003 本発明は、映像に合わせて音声を収録する(アフレコ)作業を、だれもが簡単に実施できるようにしたものであり、映像に合わせて、背景・効果音、タイミングをとるための参照音声、タイミングに合わせて変化する字幕、タイミングをとるための時間、及びタイミングをとるための周期的映像再生・収録を、同時に収録対象者に提供し、収録対象者は自分に合った情報を選択的に利用して、アフレコ作業を実施できるようにした。 JPB_0005137031.pdf
2008/7/2 2008-
173551
音声認識機能付情報処理端末 2012/8/3 5050175 20081001 本発明は、音声認識に関し、クライアント側では、個人のメールや住所録などから抽出した固有名詞辞書を持ち、サーバ側で抽出された未知語区間の音響特徴量や音節認識結果とマッチングが行われ、未知語区間に対してもっともらしい単語(端末内のデータから抽出された固有名詞)と置き換えることにより、個人が使用する単語を含む文章を頑健に認識するものである。 JPB_0005050175.pdf
2008/8/19 2008-
210639
リップシンクアニメーション作成装置、及びコンピュータプログラム 2012/10/19 5109038 20081002 本発明は、キーフレームによるリップシンクアニメーション制作において、簡単にキーフレームを編集するための3つの機能(キーフレームを口の動く速度に応じて間引く、声の大きさに応じて口をあける大きさを変える、口の動く速度に応じて口をあける大きさを変える)に関し、このキーフレーム操作における口の動く速度の評価関数、および声の大きさの評価関数を指数的に扱う感度調整パラメータを導入することにより、編集の自由度を向上させることができる。 JPB_0005109038.pdf

*「掲載特許について実施許諾の用意がございます。ただし、共有分については、共有者の同意を要します。
 ご要望がございましたら、下方連絡先までお知らせください。」
****************************
連絡先:経営統括部 知的財産チーム
電 話:(0774)95 1171
e-mail: Patent@atr.jp