特許情報:音声

(部署略号:音=音声) 
ATRホーム
English
「2014年3月31日現在」
部署 出願日 出願番号 出願件名 登録日 登録番号 外国 管理番号 概要 共有 特許公報
2002/2/22 2002-047047 言語モデルの適応化方法 2006/9/8 3850742   20011010 音声翻訳器の利用範囲(タスク)を広げる際に伴う言語モデルの利用範囲を広げる際に、別の言語で書かれた新たなダスクでのモノリンガルコーパスを翻訳し、その翻訳されたデ一夕を使ってその新たなタスクに対して言語モデルを適応化させ、そのタスクに対して単語予測力とカバレッジの点で効果的な言語モデルを作成する方法および装置。 JPB_0003850742.pdf
2002/8/23 2002-243908 統計的機械翻訳方法 2007/8/31 4006297   20021005 デコーディングアルゴリズムにおける翻訳の生成方向を右から左に、文末から生成することにし、英日翻訳のように、日本語が文末に文のならびかえの制約が強い場合、文末から生成することにより、効果が得られる。 JPB_0004006297.pdf
2002/9/11 2002-265510 音声認識装置およびプログラム
2007/3/30 3936266   20021017 In current HMM based speech recognition systems, it is difficult to supplement acoustic spectum features with additional information. On the other hand, Baysian Networks (BN) allow for easy combination of different continuous as well as discrete features by exploring conditional dependencies between them. However, the lack of efficient algorithms has limited their application in continuous speech recognition. Here, we propose new acoustic model, where HMM are used for modeling of temporal speech characteristics and state probability model is represented by BN. JPB_0003936266.pdf
2002/9/20 2002-275886 マイクロホンアレーにおけるマイクロホン受信信号の補正方法および補正装置 2007/3/16 3929863   20021007 モバイル機器でのマイクロホンアレーの利用は、各マイクロホン素子の空間的な位置が時々刻々と変化するため、音源方向が固定されていたとしても適応ビームフォーミングを行う必要があったが、本発明では、マイクロホンアレーに対する音源方向を一定に保つことにより、固定ビームフォーミングの利用が可能となり、マイクロホンアレーのシステム設計を簡単化できる。 JPB_0003929863.pdf
2002/9/24 2002-277541 音声認識システム 2007/8/31 4004368   20021014 Factor Analyzed HMMというHMMの発展的モデルをさらに一般化した音声認識システムのモデルであり、一定期間ごとに切り出されたフレーム内の特徴量の次元間の相関をより低い次元おく有漢のパラメータで表現するFactor Analyzed HMMを基本とし、音響イベントに依存したパラメータをより次元の低い空間で表わすステップと、音響イベントに独立なパラメータをより次元の低いくっかんで表わすステップの2つの譜轍鮒することにより、より一般的で高い性能を達成できるもの。 JPB_0004004368.pdf
2003/3/4 2003-056694 音声認識装置、及びコンピュータプログラム 2007/2/2 3911246   20021021 従来のNGRAMに加えて、文の完全モデル化が可能なFSAを併用した音声認識方式であり、大量の文をモデル化した巨大FSAでも扱えるように、文が含むシラブル数ごとに巨大FSAを細分化しておく構成を備えている。そして、認識処理としては、まず音声入力文をNGRAMによって認識し、入力文が含むシラブル数を同定し、その数に対応したFSAを使って入力文を再認識し、NGRAMの結果とFSAの結果の中から最終結果を決定するのである。
JPB_0003911246.pdf
2003/3/12 2003-065832 音声信号の復元装置及びコンピュータプログラム 2007/1/5 3898660   20021023 本発明は、IP網におけるパケットロスや無線網の混雑時および局の切り替え(ハンドオーバー)時に生じる、音声の途切れ(プチプチいう状態、「音とび」とも呼ばれる)を復元するものであり、具体的には、(1)音声認識状態を応用し、前後の音響情報および言語情報から途切れた区間の音素片(単語、音素、HMM状態、分布などでもよい)を推定し、(2)推定した音素片から音声合成技術により途切れた区間の音声波形を生成する。 JPB_0003898660.pdf
2003/4/14 2003-108676 節境界検出装置、機械翻訳装置及びコンピュータプログラム 2007/3/2 3924260   20021024 日本語文の形態素列から「節」の境界を検出し、その節の種類を自動的に判定するものであり、構文的に意味のある144種の節境界を、361個の規則により判定し、結果的に、性質の異なる複数のコーパスに対して、96-99%という高い正解率を得た。この検出結果は、文分割、同時通訳、局所的な構文解析、要約などの処理に応用することを可能にしている。 JPB_0003924260.pdf
2003/7/25 2003-280402 知覚試験用音声データセット作成装置、コンピュータプログラム、音声合成用サブコスト関数の最適化装置、及び音声合成装置 2006/11/17 3881970   20031010 波形接続型音声合成において、知覚特性を反映したコスト関数を用いて波形素片を選択することで、より自然性の高い音声を合成できると期待されるところ、コスト関数は様々な要因に対応する複数のサブコスト関数から構成されるが、すべてのサブコスト関数に対して知覚的評価に基づく最適化を行うものである。 JPB_0003881970.pdf
2003/8/6 2003-288293 音声の周波数特性の等化装置 2006/10/20 3869823   20031008 波形素片接続型音声合成システムは,音質向上のために大規模な音声コーパスを使用しており,その録音には数ヶ月〜数年の期間を要し、録音時期が異なることで、録音系の特性変化によって音質が変化することがあるところ、本発明は,録音系の伝達特性の変化を,パワースペクトル密度にもとづくフィルターを用い,人間の聴覚特性を考慮しつつ補正できるようにしたものである。 JPB_0003869823.pdf
2003/8/21 2003-297306 声質差評価テーブル作成装置、音声コーパスの声質差評価テーブル作成システム、及び音声合成システム 2006/11/17 3881971   20031005 音声素片接続型音声合成では,大規模な音声コーパスを使用するため,異なる時期に録音された声質の異なる音声が同一コーパス中に混在し、声質の異なる音声素片を接続すると音質劣化が生じるが、その音質劣化を軽減するために,あらかじめ聴取実験を行って録音日間の声質差をスコア化して記録しておき,音声素片選択時に声質の異なる音声素片が選択されることを防止するために利用するものである。 JPB_0003881971.pdf
2003/8/28 2003-304965 翻訳エージェントの翻訳能力評価方法 2008/4/18 4113814   20031018 DPマッチングで翻訳正解率を計算する場合、正解として日英方向であるならば入力の日本語の対訳文を利用するが、翻訳では多様な表現があるので、正解であったとしても翻訳正解率は劣化する問題があったところ、本発明は、大量の対訳コーパスから類似表現を検索し正解英文を追加することにより、表現の多様性を許容し、劣化問題を緩和するものである。 JPB_0004113814.pdf
2003/8/29 2003-307240 機械翻訳文の評価方法、および機械翻訳文の評価装置 2007/3/30 3936687   20031012 本発明は、評価対象の翻訳出力を,複数の逆方向の翻訳システムで再度翻訳し,翻訳システムへの入力と,逆翻訳の結果を比較することにより評価するものであり、原言語側での評価を可能にするため,目的言語側の知識を持たないユーザでも評価することが可能になる。また,翻訳自動評価へ応用することにより,リアルタイムでの評価も可能になる。

JPB_0003936687.pdf
2003/9/16 2003-322553 音声合成装置及びそのためのコスト計算装置、並びにコンピュータプログラム 2006/9/15 3854593   20031013 選択接続型音声合成において、選択に用いる選択尺度の計算方法を、選択時に動的に変化させることによって、それぞれの区間ごとに知覚的に影響の大きい誤差が生じることを抑制し、もって合成音声の品質を向上させるものである。 JPB_0003854593.pdf
2003/10/23 2003-363900 モデル構造作成装置、音声認識装置、及びモデル構造作成プログラム 2009/4/24 4299630   20031019 音声認識用音響モデルにおいて、モデル状態共有構造を獲得するための方法であるML-SSSにおいては、分割停止条件として何らかの制限を人手で与える必要があったところ、改善策として、分割状態選択条件および停止条件にモデル構造をより厳格に反映できる変分ベイズ法による規準を用いることにより、自動的に学習データを反映させたよりよいモデル構造が得られるものである。 JPB_0004299630.pdf
2003/12/1 2003-401706 ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム 2008/9/26 4191021   20031027 We propose a novel OOD (out-of-domain) detection framework to reject utterances that cannot be handled by the back-end of a spoken language system. The proposed approach makes use of classification confidence scores of multiple topics and trains a linear discriminant in-domain verifier using GPD (gradient probabilistic descent). Training is based on deleted interpolation of the in-domain data, and thus does not require actual OOD data, providing high portability.

JPB_0004191021.pdf
2003/12/1 2003-401724 音声認識結果の信頼度検証装置、コンピュータプログラム、及びコンピュータ 2010/3/26 4478925   20031028 A generalized word posterior probability (GWPP), a value between 0 and 1, is used as the universal distortion measure for assessing the reliability of recognized words individually.  The generalized posterior word probability is computed in a word graph, via the forward/backward algorithm, or in an N-best list, using the string likelihood of each hypothesis.  When a consensus, i.e., word arcs with the same word ID and intersecting time intervals, is reached, the corresponding word posterior probabilities are summed together to form the new generalized word posterior probability and the word graph or the N-best list is then repopulated with the newly computed GWPP's.  A minimum word error rate string is then found in the word graph by searching for the path of the maximum generalized word posterior probability, or by reordering the N-best hypotheses.  We devise a systematic way to find the optimal weights for the acoustic and language model likelihoods in computing the generalized WPP. The GWPP is useful for designing user-friendly speech recognition interface and for tagging the recognized words with a confidence measure before they are output a spoken-language machine translation module.  Furthermore, it facilitates unsupervised, decision feedback speaker or environment adaptation or self-learning in many applications without costly, time-consuming human interventions. JPB_0004478925.pdf
2004/2/23 2004-045855 FО 輪郭を合成する方法及びコンピュータプログラム 2008/11/28 4223416   20031025 Chinese is a tone language, the tone and intonation are all manifested in the fundamental frequency (F0) contours. Synthesis of the tone and intonation patterns is necessary for building a Chinese text-to-speech system.  Existing methods are not sufficient for synthesis of  natural Chinese tone and intonation patterns due to the large tone and intonation variations in speech.  In this work, we shrink an F0 contour into its underlying peaks and valleys (pitch targets), which can represent the essential features of the tone and intonation patterns. Analysis and processing are then focused on the pitch targets. The exact shape of the F0 contour can be recovered back using a functional model, given the peaks and valleys. JPB_0004223416.pdf
2004/2/4 2004-028542 音声認識システム 2009/3/13 4274962   20031049 本発明は、お互いに異なる雑音環境や発話スタイルに依存した音響モデルを用いてパラレルにデコーディングし得られた複数の仮説を最大尤度基準や単語単位での仮説統合を行う音声認識システムであり、雑音と発話スタイルが同時に変動する環境においても頑健な音声認識を実現することができるものである。
JPB_0004274962.pdf
2004/3/12 2004-071058 周波数特性等化装置 2010/5/28 4517163   20031051 本発明は、分散型音声認識における入力特性の差異を保障し認識性能を向上させるものであり、@複数の参照ベクトルを持つ。A参照ベクトルはコードの組み合わせで表現される。という特長を持ち、省メモリ、省演算量を同時に実現できるものである。 JPB_0004517163.pdf
2004/3/16 2004-075185 素片接続型音声合成装置及び方法 2009/12/18 4424024   20031059 本発明は、音声合成に関し、出現頻度の高い素片波形から優先的にアクセスが高速な記憶装置に蓄え、音声合成時には、低速な記憶装置に蓄えられた素片に対して、コスト計算においてある程度のペナルティを与え、高速にアクセスできる素片がより選択されるようにすることで、波形素片のアクセス速度を平均的に速くするものである。このペナルティの値は、速度と品質の関係から定める。
JPB_0004424024.pdf
2004/3/16 2004-073977 素片接続型音声合成装置及び方法 2010/9/17 4586386   20031058 本発明は、素片接続型音声合成に関し、予備選択基準とする予備選択コスト関数に含まれるサブコストを増やしながら候補数を絞り込んで行くことを繰り返すことで、効率的な素片選択を実現するものである。特に、前段におけるコスト計算結果を次段のコスト計算に用いることができるようにコスト関数を設計することで、高速な素片選択が実現できる。 JPB_0004586386.pdf
2004/3/16 2004-074594 中国語の声調分類装置及び中国語のF0生成装置
(Chinese Language Tone Classification Apparatus and Chinese Language F0 Generating Apparatus)
2010/10/29 4617092   20031037 There are substantial F0 variations in tonal F0 contours in Chinese continous speech. This make it very difficult to discriminate robustly the tonalities either by human labelers or by automatic tone recognizers. We proposed in this paper that anchoring based hypothesis is a theory that can consistently account for the discrimination of the tones subject to contextual F0 variations such as downstep lowering effects and contextual assimilation effects. If correct, this theory will improve significantly human understanding of tone language. Statistical distributional analyses and tone recognition results serve as partial sound evidences of our suggestion. JPB_0004617092.pdf
2004/3/30 2004-101094 発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ 2010/6/4 4521673   20031062 特徴パラメーターとして利用する正規化した音声パワーのその正規化に際し、発話終了まで待って、最大パワーを算出する必要があり、これはリアルタイム処理には使用できないところ、本発明は、音声パワーのダイナミックレンジをリアルタイムに更新することにより、擬似的ではあるが、音声パワーをリアルタイムに正規化することができるようにしたものである。 JPB_0004521673.pdf
2004/3/30 2004-098152 汎用GUI装置及び汎用GUIプログラム 2011/4/8 4715104   20031063 プログラムのオプション値やパラメータ値をGUIで設定する場合、各プログラム毎にGUIを設計し実装する必要があるが、本発明は、プログラムのオプションやパラメータを統一的にプログラム中に記述し、GUIがその情報を動的にプログラムから取得することにより、様々なプログラムのGUI環境を1つの汎用的なGUIシステムとすることができ、プログラムの追加や更新の影響を受けないようにしたものである。 JPB_0004715104.pdf
2004/3/31 2004-104090 データ処理システム設計装置及びそのためのコンピュータプログラム 2011/3/4 4691895   20031060 本発明は、データ処理に関し、Webブラウザ上で、実行可能なプログラムモジュールの中から必要なモジュールを選択し、モジュール間のデータの流れに応じて線で結ぶことにより、システムを実行するものである。 JPB_0004691895.pdf
2004/3/31 2004-104088 汎用入力データ検査装置及びプログラム 2011/11/4 4854058   20031064 オプションやパラメータの妥当性チェックは、作成やテストに工数がかかり、またその品質はプログラマの技量に大きく依存するところ、本発明は、システム全体の品質と生産性を高めるためにオプションやパラメータの制約を統一的に記述し、それを元に妥当性のチェックを行う汎用的なライブラリサービスに構成したものである。 JPB_0004854058.pdf
2004/5/21 2004-151966 機械翻訳システム、その制御装置、及びコンピュータプログラム 2007/2/23 3919771   20031046 本発明は、自然言語の原文aを別の自然言語の訳文bに翻訳するものであって、@aの訳文候補xを生成する。Axをより良い訳文yに改善する。B終了条件を満たせば、yをbとして出力するか、さもなくば@ABのステップを繰り返すものである。
JPB_0003919771.pdf
2004/8/13 10/917420 Machine Translation Apparaus and Machine Translation Computer Program 2011/4/12 7925493 20031034 本発明は、機械翻訳に関し、原文Jの訳文Eを試作し、JとEの対応を評価し、スコアSを得、Eに可能な変形(訳語や語順の変更)を施してJとの対応を評価し、最良の変形訳とスコアをEとSとして、スコアの改善がなくなるまで、繰り返すものである。  
2004/8/4 2004-227916 雑音除去装置 2010/5/14 4505597   20041010 本発明は、マイクロホンにあたる風により発生する雑音を除去するものであり、(1)風がマイクロホンにあたったとき発生する雑音の周波数特性がマイクロホンに依存すること、(2)風雑音の周波数特性が低域(音声が存在しない帯域)に強く現れることを利用し、複数の風雑音の周波数パターンを記憶し、入力された信号の低域から風雑音パターンを選択し、スペクトル上で減算することで雑音を除去するものである。 JPB_0004505597.pdf
2004/8/9 2004-232297 音声素片選択装置および音声合成装置 2010/5/21 4512846   20041009 素片選択型音声合成において、従来は1文の先頭から最後までについて様々な可能性を考慮し、その中での最適解を得ていたため、合成器に1文全てに対応する指令が入力されるまでは、音声を出力出来なかったが、本発明は、探索木構造において、その時刻での最適枝を逆に辿り、根の直下の素片を早期に確定させ、それを新たな根とする、という処理を繰り返すことにより、1文全ての入力が終わるより早く、音声を出力することを可能にしたものである。 JPB_0004512846.pdf
2004/9/16 2004-270307 音声合成方法及び音声合成プログラム 2012/04/06 4963345   20031039 音声合成であって、音声素片間の間の接続箇所に連続的な移行部を生成することによって接続に伴う知覚的な不連続感を低減するものである。 JPB_0004963345.pdf
2004/9/9 20041007
7038.5
複数の訳文候補を改良して訳文を生成し最良訳を選択する機械翻訳システム 2010/4/28 ZL20041007
7038.5
20031035 本発明は、自然言語の原文aを別の自然言語の訳文bに翻訳するものであって、@aの訳文候補xを生成する。Axをより良い訳文yに改善する。B終了条件を満たせば、yをbとして出力するが、さもなくばこれら@ABのステップを繰り返すものである。
 
2004/11/1 2004-318208 音素単位セットを最適化する方法及びシステム
(Method and system for optimizing a phonemic unit set)
2010/11/26 4631076   20041034 The problem dealt in this study is the optimization of the basic phoneme set used in an automatic speech recognition system. The current status about this issue is like one of the followings :
1) An widely accepted phoneme set is used in all kinds of LVCSR system for that language. 2)Try several heuristically determined phoneme set and select one based on the ASR recognition perrformance. 3)In some small vocabulary task, use words as the basic units.
 We proposed an optimal design of a phoneme set for a specific ASR task: task dependent phoneme set design. The basic idea is that if a deletion of one phoneme from a large phoneme set do not decrease the linguistic discrimination too much, it may be deleted in order to reduce the phoneme set. The theoretical method adopted for this is Maximum Mutual Information Criterion based Phoneme set design. And the first application is to design one phoneme set for Chinese.
JPB_0004631076.pdf
2005/1/18 2005-010639 雑音抑圧装置及び音声認識システム 2010/5/21 4512848   20041017 雑音環境下で高精度に音声認識を行うには、発話音声に重畳する雑音を抑圧する必要があるが、これを実現するためには、雑音の高精度な推定法が必要不可欠である。雑音の事前知識が無い状況で、雑音が重畳した音声から雑音を推定することは一般に困難であるが、本発明は、パーティクルフィルタという逐次推定法を用いて雑音の高速、高精度な逐次推定を可能とし、雑音環境下音声認識のための雑音抑圧手法を確立した。
JPB_0004512848.pdf
2005/12/9 2005-356665 雑音抑圧装置、コンピュータプログラム、及び音声認識システム 2010/11/5 4617497   20051026 本発明は、時間的に変動する非定常雑音が発生する環境下で、そのその雑音を正確に推定して音声認識率を改善し、かつその雑音を短時間で抑圧するものである。 JPB_0004617497.pdf
2005/3/2 2005-057993 外乱成分抑圧装置、コンピュータプログラム、及び音声認識システム 2010/9/17 4586577   20041041 本発明は、実環境下で音声認識を行う際に障害となる、雑音と残響に対して頑健な音声認識システムであって、雑音と残響が音声に与える影響を詳細にモデル化し、モデルを構成するパラメータをパーティクルフィルタと呼ばれる逐次推定法を用いることにより推定し、推定されたモデルパラメータを用いて雑音と残響の影響を取り除いて音声信号のみを取り出すことにより、実環境下での音声認識性能を改善させるものである。 JPB_0004586577.pdf
2005/3/30 2005-098067 イントネーションの変化の特徴を声調の変形により表す方法及びそのコンピュータプログラム
A method of characterizing intonation variations with tone transformation and a computer program therof
2011/8/5 4793776   20041030 This paper describes a novel method for separating actual intonation from lexical tones manifested in fundamental frequency (F0) contours. This capability is crucial in the next generation of conversation systems that must recognize and synthesize intonation variations for different speech acts and emotions. This method characterizes intonation variations in a parameter
by transforming F0 contours to the simpler components of intonation, such as the four lexical tones in Mandarin that can be fixed at appropriate values for individual speakers.   We specify the method by an algorithm that calculates
intonation variations and test it by analyzing Mandarin speech samples.
JPB_0004793776.pdf
2005/7/28 2005-218476 頭部動作自動生成のための頭部動作学習装置及び頭部動作合成装置並びにコンピュータプログラム 2010/10/8 4599606   20051005 本発明は、音声に同期した頭部動作を自動生成するものであって、音声と頭部動作を同時収録したデータを元に、音声特徴量(入力)、音声の感情強度(入力)、頭部動作(出力)の関係をニューラルネットワークで学習し、新規の音声に対して、音声特徴量を算出後、それに対する頭部動作をニューラルネットワークを用いて合成するものである。入力特徴量の感情強度パラメータを変更することで、合成される頭部動作の感情表現の強さを制御することができる。 JPB_0004599606.pdf
2005/8/19 2005-238236 音声認識結果の検査装置及びコンピュータプログラム 2011/6/10 4756499   20041050 本発明は、音声翻訳装置において、トータルの音声翻訳性能が高くなるように音声認識処理に信頼度を付与し翻訳部に引き渡すための音声認識信頼度評価装置に関する。具体的には、翻訳処理で用いられるフレーズ情報を信頼度計算に利用し、信頼度を高める手法である。 JPB_0004756499.pdf
2005/9/16 2005-269624 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム 2010/11/12 4621936   20051020 音声合成システムによる合成音の自然性の向上には,適切なポーズ位置の推定が重要である。
本発明は、 Naive Markov Model という新たな統計モデルを導入することで,入力テキスト全体でのポーズ数およびポーズ位置のバランスを考慮しながら,非常に低計算コストで精度良くポーズ位置を推定することができるものである。
JPB_0004621936.pdf
2005/9/2 2005-254424 音響モデル生成装置、およびプログラム 2011/1/7 4654452   20051002 We propose an acoustic model training technique which
is robust against outliers such as clipping, unexpected noise, poorly
pronounced word segments, or mis-transcriptions, which deteriorate the
quality of the acoustic models and in turn decrease speech recognition
performance.  The outlier-robust acoustic model training technique is
based on a maximum likelihood (ML) criterion and automatically detects
and removes outliers from the training data.
JPB_0004654452.pdf
2006/2/23 2006-047385 音声認識システム及びコンピュータプログラム 2011/10/7 4836076   20051035 複数の音声認識器から得られた仮説がお互いに相補的な場合(例えば、認識器Aは前半が正解し、認識器Bは後半が正解している場合)、個々の仮説の正しい部分を適切に抽出することによって、より高い音声認識性能が得られるものである。
本発明は、個々の仮説の正しい部分の抽出に、単語事後確率を基礎とした単語信頼度を用いものである。音声認識実験により、従来の音響尤度を用いた手法の場合より高い音声認識性能が得られた。
JPB_0004836076.pdf
2006/3/3 2006-057304 素片接続型音声合成装置及びコンピュータプログラム 2009/4/10 4292191   20051032 本発明は、素片接続型音声合成において、素片データベースから取り出す素片候補の数を、事前実験の結果を用いて構築した回帰木を用いて決定することにより、素片選択において考慮する素片候補数を減らし、従来と同等の品質の音声をより短時間で生成することができるものである。 JPB_0004292191.pdf
2007/3/9 2007-061107 音響空間共有装置 2011/12/2 4873316   20061011 本発明は、複数の利用者が音響空間を共有しながら、他者とコミュニケーションを交わすことを可能とする音場通信システムに関し、共有音場として利用する音響空間データをデータベースに保存しておくこと、利用者は様々な音響空間を体験しながら他者とコミュニケーションを交わすことが可能となるものである。 JPB_0004873316.pdf
2007/7/10 2007-180505 リップシンクアニメーション作成装置、コンピュータプログラム及び顔モデル生成装置 2010/11/5 4617500   20061013 本発明は、視覚素の部分集合から口形状アニメーションを生成するものであって、事前に対象となる言語の音素と視覚素の関係を標準モデル内で構築・正規化し、アニメーション製作時には、視覚素の部分集合のみを準備し、標準モデルにて正規化された視覚素との対応を指定することで、残りの対応の取れていない視覚素を対応の取れた視覚素部分集合の重み付き線形和として表現する重みを推定し、音素-視覚素変換系を補完するものである。
JPB_0004617500.pdf
2007/9/12 2007-236561 軌道探索装置 2012/11/30 5141876   20071004 本発明は,機械に参照点に依存した空間的移動の概念を学習させた後で,学習した概念を用いて行動系列を計画するものである。概念の学習では,参照点が非観測である動画像情報から,「ちかづく」「のせる」等の空間的移動を表す確率モデルを隠れマルコフモデルを用いて学習し、次の動作の生成では,ユーザが与えた目標点への軌道を,学習した概念の系列としてユーザに呈示すると同時に,確率モデルを座標変換し,最尤軌道を生成するのである。 JPB_0005141876.pdf
2007/12/25 2007-332427 木構造辞書を記録した記憶媒体、木構造辞書作成装置、及び木構造辞書作成プログラム 2012/11/2 5120749   20071007 本発明は、木構造辞書に関し、未知語集合をクラスカテゴリ毎に分類し、同じクラスカテゴリに分類した未知語集合に対して、既存の認識辞書の同じクラスカテゴリの単語の1つに未知語を割り当てることにより、未知語に対するn-gram確率を割り当てるものである。 JPB_0005120749.pdf
2008/10/24 2008-273704 台詞音声作成装置、発話音声収録装置、およびコンピュータプログラム 2012/11/22 5137031   20081003 本発明は、映像に合わせて音声を収録する(アフレコ)作業を、だれもが簡単に実施できるようにしたものであり、映像に合わせて、背景・効果音、タイミングをとるための参照音声、タイミングに合わせて変化する字幕、タイミングをとるための時間、及びタイミングをとるための周期的映像再生・収録を、同時に収録対象者に提供し、収録対象者は自分に合った情報を選択的に利用して、アフレコ作業を実施できるようにした。
JPB_0005137031.pdf
2008/7/2 2008-173551 音声認識機能付情報処理端末 2012/8/3 5050175   20081001 本発明は、音声認識に関し、クライアント側では、個人のメールや住所録などから抽出した固有名詞辞書を持ち、サーバ側で抽出された未知語区間の音響特徴量や音節認識結果とマッチングが行われ、未知語区間に対してもっともらしい単語(端末内のデータから抽出された固有名詞)と置き換えることにより、個人が使用する単語を含む文章を頑健に認識するものである。 JPB_0005050175.pdf
2008/8/19 2008-210639 リップシンクアニメーション作成装置、及びコンピュータプログラム 2012/10/19 5109038   20081002 本発明は、キーフレームによるリップシンクアニメーション制作において、簡単にキーフレームを編集するための3つの機能(キーフレームを口の動く速度に応じて間引く、声の大きさに応じて口をあける大きさを変える、口の動く速度に応じて口をあける大きさを変える)に関し、このキーフレーム操作における口の動く速度の評価関数、および声の大きさの評価関数を指数的に扱う感度調整パラメータを導入することにより、編集の自由度を向上させることができる。 JPB_0005109038.pdf