1、然后查看时间线。非常机械化的操作,非常适合计算机来做。通过搜索很快找到了解决方案。使用微软语音SDK python python win。尽管微软的语音识别引擎已经非常强大,
2、但是用它做字幕还有很长的路要走。字幕做不到,但是用它来控制浏览器还是有更多的错误。发现用语音功能操作IE浏览器非常方便。只要设置好句子,IE浏览器就能自动进行相关操作。
【资料图】
3、下面是我实现的一些功能。(=符号前面是您要说的内容,后面是浏览器要做的事情)
4、显示浏览器=打开浏览器,谷歌=进入谷歌的页面,百度=进入百度的页面,优酷=进入优酷的页面等等。Back=返回上一页,最大化浏览器,下拉=下拉网页,
5、拉起=拉起页面,放大=放大页面,缩小=缩小页面,关闭浏览器=关闭浏览器。
6、构建测试环境:
7、1.从微软官网下载SpeechSDK51.exe和SpeechSDK51LangPack.exe
8、2.下载Python2.6 PythonWin wxPython和脚本文件来启动语音识别。从这里打包并下载。
9、3.安装SpeechSDK51.exe,SpeechSDK51LangPack.exe
10、4.安装Python2.6,PythonWin,wxPython
11、5.运行开始菜单-所有程序-python 2.6-python win,
12、Select tools-COM MakePy utility-Microsoft voice object library 5.0
13、6.在控制面板的语音中,在语言中选择Microsoft简体中文识别器,在语音选择中选择Microsoft简体中文。
14、环境搭建完成,运行SpeechGui.py脚本就可以来用声音操控浏览器。不过由于Python+PythonWin的强大威力,不单单只有IE浏览器可以进行该操作,
15、只要软件能够支持com的应用就都可以显示语音操控,比如微软的Windows Media Player,Word,Excel等软件。强烈建议大家自己手动去发掘和制作更多有意思的功能。
本文到此结束,希望对大家有所帮助。
标签: