查看: 999|回复: 10
|
[询问] 语音识别、手写识别
[复制链接]
|
|
发表于 24-3-2005 09:49 PM
|
显示全部楼层
sson 于 24-3-2005 08:56 PM 说 :
有谁知道如何达到
理论、原理、方法等等,谢谢
晤 ... 这些都需要DSP方面的知识呢! 你想写一个哦? ... 对ANN, HMM, FUZZY 熟悉吗? 弄语音/手写识别 ... 如果要重头研发的话, 是必须要收集大量的语音/手写samples的叻!
简单来说就是必须用一些适当的方法(如FFT), 从你的 input, extract出它最主要的signal, 然后和你的sample database做个比较! ...
要说的话可是一本书也!! 再说我也不是很在行! 不过如果有兴趣讨论, 我很喜欢这个主题啊! 之前又看过我的roomate做一个辨别abc...z的语音识别! 嘻嘻 ... 有用我的声音哦! |
|
|
|
|
|
|
|
楼主 |
发表于 25-3-2005 07:45 AM
|
显示全部楼层
斷羽鳥 于 24-3-2005 09:49 PM 说 :
晤 ... 这些都需要DSP方面的知识呢! 你想写一个哦? ... 对ANN, HMM, FUZZY 熟悉吗? 弄语音/手写识别 ... 如果要重头研发的话, 是必须要收集大量的语音/手写samples的叻!
简单来说就是必须用一些适当的方法 ...
哈哈,好像好难……
不过只制作一些识别,应该不需要有巨量的 samples 吧。
不知可以有份你的 roomate 做的识别吗?
看来语音识别的运算实在有点难……
手写识别运算理应没有如此复杂,不知你可知道其运算原理、方法? |
|
|
|
|
|
|
|
发表于 25-3-2005 12:25 PM
|
显示全部楼层
不好意思叻, 我roomate做的可是5-6年前的project了! 我都没看见他了!
至于想要左手写识别, 我刚刚看到一个入门网页
http://www.dontveter.com/basisofai/char.html
有介绍初步pre-processing, digitizing 的概念! algorithm方面, 就没什么讲到, 不过如果是如他所说的, nearest neighbourhood, 或者是backprop, 数学方面我还有点概念咯! |
|
|
|
|
|
|
|
发表于 25-3-2005 06:32 PM
|
显示全部楼层
I am now working in a company about speech technologies.
http://www.nusuara.com
ASR - automatic speech recognition
TTS - text-to-speech
...... |
|
|
|
|
|
|
|
发表于 25-3-2005 06:55 PM
|
显示全部楼层
我学校有一组的FYP是做signature verification
跟手写识别基本一样
他们是用matlab做的 |
|
|
|
|
|
|
|
楼主 |
发表于 25-3-2005 08:24 PM
|
显示全部楼层
不错,谢谢,这让在下有了初步的了解。
southpole 于 25-3-2005 06:32 PM 说 :
I am now working in a company about speech technologies.
http://www.nusuara.com
ASR - automatic speech recognition
TTS - text-to-speech
......
那么希望你可以多多来这儿分享一些技术心得。
ctrl 于 25-3-2005 06:55 PM 说 :
我学校有一组的FYP是做signature verification
跟手写识别基本一样
他们是用matlab做的
对不起,在下见识浅薄,不知什么是 matlab ,可否解一解?
对了,不是各位有没有滑鼠辨位识别的理论、原理、方法?
就是捕捉用户使用滑鼠做了什么动作一类的,像往右移动、画圆啦等等 |
|
|
|
|
|
|
|
发表于 26-3-2005 06:57 AM
|
显示全部楼层
|
|
|
|
|
|
|
发表于 26-3-2005 11:03 AM
|
显示全部楼层
我刚刚才在想, 网络中应该会有一些开源的手写识别引擎吧 ...等下找找看! 如果有人找到麻烦通知声哦!?!
MATLAB 是 MATRIX LABORATORY 的速写! 是种 interpreter language, 也可以/有内建 compiler, 还有C/C++/FORTRAN 接口. 虽然运行速度远不必FORTRAN/C快, 但是有着强大的矩阵处理方案.还有就是它好似'外挂'的工具箱(toolbox), 易用性, 让他成为科学/学术界一种强大的工具. 不只是electronic/electrical, engineering方面, 还有其他很多的领域, MATLAB都用得上!
-image processing, statistic, symbolic mathematic, system simulation, signal processing ... etc etc。
还有就是它的webserver, 可用来建设复杂性较高的, web interactive plotting的引擎!我喜欢它的plotting, 易用, 可朔性高, publication quality. 在我心里, 它简直和gnuplot平起平坐! |
|
|
|
|
|
|
|
发表于 11-12-2005 03:24 AM
|
显示全部楼层
本人现在在开发gesture recognition 的prototype..有没有人明白condensation algorithm 的原理, 我读那堆thesis 读到一头雾水。。。 |
|
|
|
|
|
|
|
发表于 12-12-2005 10:39 AM
|
显示全部楼层
据说这也是AI的一部分, 好像是一种Neutron Network的方式(不知有没有记错名字), 一种Self Learning, 电脑重复学习Pattern之后才能够准确辨认出。 就是说必须先教导电脑怎样的Pattern代表什么字之后电脑才有辨认的能力。
详细情形需要参考我的AI Lecture Note了。。。 |
|
|
|
|
|
|
| |
本周最热论坛帖子
|