200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 语音控制方法 可穿戴设备及计算机可读存储介质与流程

语音控制方法 可穿戴设备及计算机可读存储介质与流程

时间:2018-12-10 00:14:52

相关推荐

语音控制方法 可穿戴设备及计算机可读存储介质与流程

本申请涉及语音控制领域,尤其涉及一种语音控制方法、可穿戴设备及计算机可读存储介质。

背景技术:

随着电子设备的快速发展和智能化程度越来越高,当前市面上出现了腕机这一新型科技产品。作为一种可穿戴设备,腕机具有体积小、容易携带等优势,为广大使用者提供了更方便有趣的终端产品。但同时,腕机的屏幕较为狭窄,用户在屏幕操作体验上极为不友好,在遇到需要输入密码、按钮较小等场景尤为不方便。用户容易因为屏幕狭窄造成误操作,这给用户带来了极大的不便,严重降低了用户使用体验。因此,如何改善腕机等可穿戴设备的小屏操作体验成为了目前亟待解决的技术问题。

技术实现要素:

本发明的主要目的在于提供一种语音控制方法、可穿戴设备以及计算机可读存储介质,旨在解决如何改善腕机等可穿戴设备的小屏操作体验的技术问题。

为实现上述目的,本发明实施例提供一种语音控制方法,所述方法应用于可穿戴设备,所述语音控制方法包括:

基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令;

若是,则获取当前显示页面的界面布局,并提取所述界面布局上各个控件的控件信息;

依据所有控件信息检测所述控制指令是否为有效控制指令;

若是,则基于指令分析集映射的模拟点击脚本执行所述有效控制指令。

可选地,所述依据预设的指令分析集检测所述语音信息是否为控制指令的步骤包括:

提取语音信息中的所有语音关键词,并确认各语音关键词的关键词属性,所述关键词属性包括动词关键词和名词关键词;

依据预设的指令分析集对所述语音关键词进行权重打分,以获得各语音关键词的权重分;

获取各语音关键词中权重分最高的最优动词关键词和最优名词关键词;

若检测到指令分析集中存在与最优动词关键词和最优名词关键词相匹配的映射指令,则将所述映射指令确认为控制指令。

可选地,所述若检测到指令分析集中存在与最优动词关键词和最优名词关键词相匹配的映射指令,则将所述映射指令确认为控制指令的步骤还包括:

若检测到映射指令不止一个,则将所述映射指令中占用内存空间最小的映射指令确认为控制指令。

可选地,所述当前显示页面包括当前页面标识,所述控件信息包括当前控件标识,所述依据所有控件信息检测所述控制指令是否为有效控制指令的步骤包括:

提取所述控制指令中的目标页面标识和目标控件标识;

检测所述当前显示页面上是否存在与目标页面标识映射的当前页面标识,以及所述控件信息是否存在与目标控件标识映射的当前控件标识;

若所述当前显示页面上存在与目标页面标识映射的当前页面标识,且所述控件信息是否存在与目标控件标识映射的当前控件标识,则确认所述控制指令为有效控制指令。

可选地,所述基于指令分析集映射的模拟点击脚本执行所述有效控制指令的步骤包括:

若检测到所述控制指令为特定控制指令,则在当前显示页面显示时长为预设时间值的时间进度滚动条,并在预设时间值之后基于指令分析集映射的模拟点击脚本执行所述有效控制指令。

可选地,所述基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令的步骤包括:

若基于预置的语音采集模块检测到专属唤醒指令,则实时获取所述可穿戴设备所处环境的语音信息。

可选地,所述方法还包括:

若检测到用户输入的指令自定义指令,则输出所述指令分析集中的所有指令项;

获取基于所有指令项触发的选择指令,并获取所述选择指令对应的待选指令项的指定顺序,所述待选指令项包括多项指令项;

若检测到所述待选指令项对应的编辑组合指令,则基于所述编辑组合指令按所述指定顺序将所述待选指令项组合为目标指令项,并输出该目标指令项的重命名输入框;

将基于重命名输入框输入的名称作为目标指令项的指令名称,并将所述目标指令项加入到指令分析集中。

可选地,所述基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令的步骤之后还包括:

对所述语音信息进行音质识别,以获取该语音信息的音质等级;

若所述音质等级小于预设音质等级,则输出重新输入语音信息的提示信息。

此外,为实现上述目的,本发明还提供一种可穿戴设备;

所述可穿戴设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:

所述计算机程序被所述处理器执行时实现如上所述的语音控制方法的步骤。

此外,为实现上述目的,本发明还提供计算机存储介质;

所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的语音控制方法的步骤。

本发明实施例提出的一种语音控制方法、设备及计算机可读存储介质,通过基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令;若是,则获取当前显示页面的界面布局,并提取所述界面布局上各个控件的控件信息;依据所有控件信息检测所述控制指令是否为有效控制指令;若是,则基于指令分析集映射的模拟点击脚本执行所述有效控制指令。通过以上方案,使得腕机等可穿戴设备可以在用户的语音控制下实现最大程度的操控优化体验,从而解决了腕机等可穿戴设备的小屏操作体验不友好的技术问题,避免了可穿戴设备因屏幕狭窄导致用户在输入密码,点击小型控件上遇到的操作不便或误操作的现象发生,进而提升了可穿戴设备的可操控性,改善用户的操控体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的可穿戴设备一种实施方式的硬件结构示意图;

图2为本申请实施例提供可穿戴设备一种实施方式第一视角的硬件示意图;

图3为本申请实施例提供可穿戴设备一种实施方式第二视角的硬件示意图;

图4为本申请实施例提供可穿戴设备一种实施方式第三视角的硬件示意图;

图5为本申请实施例提供的穿戴设备一种实施方式第四视角的硬件示意图;

图6为本申请实施例提供语音控制方法一实施例的流程示意图;

图7为图6中步骤S10的细化流程示意图;

图8为图6中步骤S30的细化流程示意图;

图9为本申请实施例提供语音控制方法又一实施例的流程示意图。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。

本发明实施例中提供的可穿戴设备包括智能手环、智能手表、以及智能手机等移动终端。随着屏幕技术的不断发展,柔性屏、折叠屏等屏幕形态的出现,智能手机等移动终端也可以作为可穿戴设备。本发明实施例中提供的可穿戴设备可以包括:RF(Radio Frequency,射频)单元、WiFi模块、音频输出单元、A/V(音频/视频)输入单元、传感器、显示单元、用户输入单元、接口单元、存储器、处理器、以及电源等部件。

后续描述中将以可穿戴设备为例进行说明,请参阅图1,其为实现本发明各个实施例的一种可穿戴设备的硬件结构示意图,该可穿戴设备100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的可穿戴设备结构并不构成对可穿戴设备的限定,可穿戴设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图1对可穿戴设备的各个部件进行具体的介绍:

射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,射频单元101可以将上行信息发送给基站,另外也可以将基站发送的下行信息接收后,发送给可穿戴设备的处理器110处理,基站向射频单元101发送的下行信息可以是根据射频单元101发送的上行信息生成的,也可以是在检测到可穿戴设备的信息更新后主动向射频单元101推送的,例如,在检测到可穿戴设备所处的地理位置发生变化后,基站可以向可穿戴设备的射频单元101发送地理位置变化的消息通知,射频单元101在接收到该消息通知后,可以将该消息通知发送给可穿戴设备的处理器110处理,可穿戴设备的处理器110可以控制该消息通知显示在可穿戴设备的显示面板1061上;通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信,具体的可以包括:通过无线通信与网络系统中的服务器通信,例如,可穿戴设备可以通过无线通信从服务器中下载文件资源,比如可以从服务器中下载应用程序,在可穿戴设备将某一应用程序下载完成之后,若服务器中该应用程序对应的文件资源更新,则该服务器可以通过无线通信向可穿戴设备推送资源更新的消息通知,以提醒用户对该应用程序进行更新。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(Code Division Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous Code Division Multiple Access,时分同步码分多址)、FDD-LTE(Frequency Division Duplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time Division Duplexing-Long Term Evolution,分时双工长期演进)等。

在一种实施方式中,可穿戴设备100可以通过插入SIM卡来接入现有的通信网络。

在另一种实施方式中,可穿戴设备100可以通过设置esim卡(Embedded-SIM),来实现接入现有的通信网络,采用esim卡的方式,可以节省可穿戴设备的内部空间,降低厚度。

可以理解的是,虽然图1示出了射频单元101,但是可以理解的是,射频单元101其并不属于可穿戴设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。可穿戴设备100可以单独通过wifi模块102来实现与其他设备或通信网络的通信连接,本发明实施例并不以此为限。

WiFi属于短距离无线传输技术,可穿戴设备通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于可穿戴设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

音频输出单元103可以在可穿戴设备100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与可穿戴设备100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。

A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。

在一种实施方式中,可穿戴设备100包括有一个或多个摄像头,通过开启摄像头,能够实现对图像的捕获,实现拍照、录像等功能,摄像头的位置可以根据需要进行设置。

可穿戴设备100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在可穿戴设备100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等。

在一种实施方式中,可穿戴设备100还包括接近传感器,通过采用接近传感器,可穿戴设备能够实现非接触操控,提供更多的操作方式。

在一种实施方式中,可穿戴设备100还包括心率传感器,在佩戴时,通过贴近使用者,能够实现心率的侦测。

在一种实施方式中,可穿戴设备100还可以包括指纹传感器,通过读取指纹,能够实现安全验证等功能。

显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。

在一种实施方式中,显示面板1061采用柔性显示屏,采用柔性显示屏的可穿戴设备在佩戴时,屏幕能够进行弯曲,从而更加贴合。可选的,所述柔性显示屏可以采用OLED屏体以及石墨烯屏体,在其他实施方式中,所述柔性显示屏也可以是其他显示材料,本实施例并不以此为限。

在一种实施方式中,可穿戴设备的显示面板1061可以采取长方形,便于佩戴时环绕。在其他实施方式中,也可以采取其他方式。

用户输入单元107可用于接收输入的数字或字符信息,以及产生与可穿戴设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。

在一种实施方式中,可穿戴设备100的侧边可以设置有一个或多个按钮。按钮可以实现短按、长按、旋转等多种方式,从而实现多种操作效果。按钮的数量可以为多个,不同的按钮之间可以组合使用,实现多种操作功能。

进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现可穿戴设备的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现可穿戴设备的输入和输出功能,具体此处不做限定。比如,当通过射频单元101接收到某一应用程序的消息通知时,处理器110可以控制将该消息通知显示在显示面板1061的某一预设区域内,该预设区域与触控面板1071的某一区域对应,通过对触控面板1071某一区域进行触控操作,可以对显示面板1061上对应区域内显示的消息通知进行控制。

接口单元108用作至少一个外部装置与可穿戴设备100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到可穿戴设备100内的一个或多个元件或者可以用于在可穿戴设备100和外部装置之间传输数据。

在一种实施方式中,可穿戴设备100的接口单元108采用触点的结构,通过触点与对应的其他设备连接,实现充电、连接等功能。采用触点还可以防水。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器110是可穿戴设备的控制中心,利用各种接口和线路连接整个可穿戴设备的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行可穿戴设备的各种功能和处理数据,从而对可穿戴设备进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。

可穿戴设备100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图1未示出,可穿戴设备100还可以包括蓝牙模块等,在此不再赘述。可穿戴设备100通过蓝牙,可以与其他终端设备连接,实现通信以及信息的交互。

请参考图2-图4,为本发明实施例提供的一种可穿戴设备一种实施方式下的结构示意图。本发明实施例中的可穿戴设备,包括柔性屏幕。在可穿戴设备展开时,柔性屏幕呈长条形;在可穿戴设备处于佩戴状态时,柔性屏幕弯曲呈环状。图2及图3示出了可穿戴设备屏幕展开时的结构示意图,图4示出了可穿戴设备屏幕弯曲时的结构示意图。

基于上述各个实施方式,可以看到,若所述设备为手表、手环或者可穿戴式设备时,所述设备的屏幕可以不覆盖设备的表带区域,也可以覆盖设备的表带区域。在此,本申请提出一种可选的实施方式,在本实施方式中,所述设备可以为手表、手环或者可穿戴式设备,所述设备包括屏幕以及连接部。所述屏幕可以为柔性屏幕,所述连接部可以为表带。可选的,所述设备的屏幕或者屏幕的显示区可以部分或者全部的覆盖在设备的表带上。如图5所示,图5为本申请实施例提供的一种可穿戴设备一种实施方式的硬件示意图,所述设备的屏幕向两侧延伸,部分的覆盖在设备的表带上。在其他实施方式中,所述设备的屏幕也可以全部覆盖在所述设备的表带上,本申请实施例并不以此为限。

本发明提供一种语音控制方法,该语音控制方法主要应用于可穿戴设备上,

具体地,在本发明语音控制方法第一实施例中,参照图6,语音控制方法包括:

步骤S10,基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令;

语音采集模块为内置在可穿戴设备上的采集单元,在本实施例中,可穿戴设备通过语音采集模块实时接收以获取所处环境的语音信息。由于语音信息的来源是外界,因此存在多种声源。例如,可能是儿童的呢喃学语,可能是街道上汽车的行驶声音,也可能是用户当前对可穿戴设备的语音指令等等。这些声源形成的声音都会被语音采集模块获取到,形成语音信息。但这些语音信息是否对可穿戴设备有控制作用,则需要对其进行进一步判定。

本实施例中预设有指令分析集,所述指令分析集指的是开发人员预先设置在可穿戴设备中的指令集,其中包括大量语音指令项的解析句式模板,可用于对所接收到的语音信息进行语义比照筛选,从而匹配出符合指令分析集中句式模板的语音信息。通过预设的指令分析集,可穿戴设备能够检测所述语音信息是否为控制指令。所述控制指令即为设备筛选出的符合指令分析集中语音解析句式模板的语音信息。

进一步地,假设在可穿戴设备中长期保持实时语音获取的状态,那么语音控制模块将持续消耗电量,而可穿戴设备在未进行电量补充时,其电池电量处于一个快速减少的状态中,这种情况会对可穿戴设备的电力续航形成不容忽视的考验。因此,如何在保持实时获取语音信息的同时,有效节省可穿戴设备的电量,提高可穿戴设备的续航能力,是当前方案的进一步优化方向。

基于上述优化方向,在又一实施例中,可穿戴设备采用了语音采集状态切换的技术。具体如下,所述基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息的步骤包括:

若基于预置的语音采集模块检测到专属唤醒指令,若基于预置的语音采集模块检测到专属唤醒指令,则实时获取所述可穿戴设备所处环境的语音信息。

在该实施例中,可穿戴设备预设了专属唤醒指令,以作为设备启动指令。可穿戴设备的语音采集模块分为两种状态,第一种为启动指令采集状态;第二种为语音信息采集状态。若设备处于待机前提下,则该实施例中设备只处于启动指令采集状态,即当前只接收与专属唤醒指令相关的语音信息,只有接收到专属唤醒指令,后续才进行语音信息获取和筛选判断,否则无论从设备所处环境中获取到什么语音信息,都不做操控。若设备在启动指令采集状态下获取到专属唤醒指令,则直接进行语音信息采集状态进行语音信息的获取、筛选和比照。例如,专属唤醒指令为“你好,我的腕机。”在可穿戴设备处于待机前提下为启动指令采集状态,语音采集模块进行低功耗运行,外界的语音信号声纹若不符合专属唤醒指令的声纹特征,则不做任何动作。只有检测到语音信号声纹符合“你好,我的腕机。”的声纹特征时,可穿戴设备的语音采集模块才提高采集效率,进入语音信息采集状态。如此一来,通过状态切换,设备可大幅度降低电量消耗,从而提高设备的语音控制续航能力。可理解的是,上述专属唤醒指令仅为举例。

步骤S20,若是,则获取当前显示页面的界面布局,并提取所述界面布局上各个控件的控件信息;

当设备判定语音信息为控制指令时,则定位到当前设备所点亮的屏幕区间中的当前显示页面,并获取当前显示页面的界面布局。可以理解的是,可穿戴设备的当前显示页面中通常都是功能性控件,这些控件的位置和所在区间都是预设的。因此可获取到当前显示页面的界面布局,从而识别出该界面布局上的各个空间,并提取出各个控件的控件信息。所述控件信息为当前控件的属性信息,包括当前控件标识、控件长宽、控件颜色等等。

步骤S30,依据所有控件信息检测所述控制指令是否为有效控制指令;

获取到控件信息之后,设备可依据所有控件的控件信息检测当前所述控件指令是否为有效控制指令。

具体地,参照图8,所述当前显示页面包括当前页面标识,所述控件信息包括当前控件标识,所述依据所有控件信息检测所述控制指令是否为有效控制指令的步骤包括:

步骤S31,提取所述控制指令中的目标页面标识和目标控件标识;

步骤S32,检测所述当前显示页面上是否存在与目标页面标识映射的当前页面标识,以及所述控件信息是否存在与目标控件标识映射的当前控件标识;

在本实施例中,当前控件标识代表了当前显示页面上的当前控件的id编号,而控制指令中必定指定了所要控制的目标控制页面的目标页面标识和需要控制的目标控件的目标控件标识(即id编号)。

而判断控制指令是否为有效控制指令,需要确认以下两方面:

1,控制指令能否在当前显示页面中执行;

2,控制指令能否在当前显示页面检测到要控制的控件对象。

由于可穿戴设备的当前显示页面有且仅有一个。因此,设备需要先检测当前显示页面是否有与目标页面标识匹配的当前页面标识,同时还要检测控件信息中是否有与目标控制标识匹配的当前页面标识。例如,目标页面标识为point-1,目标控件标识为widget-1,而当前显示页面的当前页面标识为point-1;当前控件标识有:widget-1,widget-2和widget-3。那么目标页面标识与当前页面标识相互映射,目标控件标识和控件信息中的其中一个当前控件标识相互映射。但是,若当前页面标识为point-2,则当前页面标识与目标页面标识并不映射,此时,检测结果将为不存在与目标页面标识映射的当前页面标识。

步骤S33,若所述当前显示页面上存在与目标页面标识映射的当前页面标识,且所述控件信息是否存在与目标控件标识映射的当前控件标识,则确认所述控制指令为有效控制指令。

若同时存在与目标页面标识映射的当前页面标识,以及与目标控件标识映射的当前控件标识,则证明当前的控制指令具备可操作性,能够在当前状态中被设备实现,属于意义明确且可实现的控制指令。

步骤S40,若是,则基于指令分析集映射的模拟点击脚本执行所述有效控制指令。

当确认所述控制指令为有效控制指令时,即证明当前环境中的语音信息能够被可穿戴设备正常识别和操作。在设备的指令分析集当中,除了大量语音指令项的解析句式模板,还包括了对应解析句式模板的操作脚本,这种操作脚本系模拟点击脚本程序。所述模拟点击脚本指的是完成对应解析句式模板的操作步骤的自动化程序,而解析句式模板又对应着有效控制指令,因此设备科基于指令分析集映射的模拟点击脚本执行所述有效控制指令。例如,有效控制指令为“将输入框中光标左边的‘a联系人’替换为‘b联系人’。”那么设备的执行步骤将对应该有效指令对应的模拟点击(即操作脚本),并根据该模拟点击定位到光标左边的“a联系人”,并根据有效控制指令中提供的“b联系人”,将其替换为“a联系人”。

本申请基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令;若是,则获取当前显示页面的界面布局,并提取所述界面布局上各个控件的控件信息;依据所有控件信息检测所述控制指令是否为有效控制指令;若是,则基于指令分析集映射的模拟点击脚本执行所述有效控制指令。通过以上方案,使得腕机等可穿戴设备可以在用户的语音控制下实现最大程度的操控优化体验,从而解决了腕机等可穿戴设备的小屏操作体验不友好的技术问题,避免了可穿戴设备因屏幕狭窄导致用户在输入密码,点击小型控件上遇到的操作不便或误操作的现象发生,进而提升了可穿戴设备的可操控性,改善用户的操控体验。

进一步地,基于第一实施例提出本发明语音控制方法的第二实施例,在本实施例中,参照图7,所述依据预设的指令分析集检测所述语音信息是否为控制指令的步骤包括:

步骤S11,提取语音信息中的所有语音关键词,并确认各语音关键词的关键词属性,所述关键词属性包括动词关键词和名词关键词;

在本实施例中,设备在检测语音信息时,将提取语音信息中的所有语音关键词。所述语音关键词即语音信息中的有效词语,例如语音信息为“提高音乐播放器中的音量”,此时,设备提取到的语音关键词为“提高”、“音乐播放器”和“音量”,其中的“中”和“的”将被识别为语音助词而省略。在获取到语音关键词之后,设备将确认各关键词的关键词属性,从而进一步确认各关键词所对应的指令信息。本实施例中,关键词属性包括动词关键词和名词关键词。所述动词关键词代表着需要设备改变的设备状态,所述名词关键词代表着需要设备改变的控制对象。明确了关键词属性,有助于明确该语音信息所要执行的操作内容。

步骤S12,依据预设的指令分析集对所述语音关键词进行权重打分,以获得各语音关键词的权重分;

语音关键词中的动词关键词(或名词关键词)可能不止一个,例如“点击‘输入’按钮”中的动词关键词包括“点击”和“输入”,名词关键词则只有“按钮”。那么就需要进行多个同类关键词进行筛选,并以权重分的形式获取。

所述权重打分是对语音关键词的进一步提取。在指令分析集中的大量语音指令项包括了大量的名词和动词,预示着对应动词或名词的应用程度。因此,预设的指令分析集首先需要具有普遍性,其次才是新开发的功能指令。例如,指令分析集中对“打开音乐播放器”、“回复短信”等常用指令的权重分要设置得更高些,而对“打开本机设备情况”、“切换为省电模式”这种非常用指令的权重分要设置得偏低些。当然,以上举例仅以应用频率的大小为参考,指令分析集的权重打分是将关键词顺序、应用场景的范围大小以及组合次数的多少等等个方面因素综合作为评判因素,才可以获得最精准的权重分。

步骤S13,获取各语音关键词中权重分最高的最优动词关键词和最优名词关键词;

步骤S14,若检测到指令分析集中存在与最优动词关键词和最优名词关键词相匹配的映射指令,则将所述映射指令确认为控制指令。

根据预设指令分析集中对语音关键词的权重打分,设备可获取到语音关键词中权重分最高的最优动词关键词和最优名词关键词。最优动词关键词和最优名词关键词作为本次语音信息所要指代的指令信息,并从指令分析集中进行指令匹配,以获取到相关的映射指令,从而剔除无意义的语音关键词。例如“播放”最优动词关键词和“xx歌曲”最优名词关键词;以及“打开”最优动词关键词和“B软件”最优名词关键词等等。通过对以上关键词的映射匹配,定位出真正有意义的语音信息,而像“输入通讯软件”、“完成音乐播放器”和“剪切系统更新”这类意义不明的语音信息均不属于控制指令。

进一步地,所述若检测到映射指令不止一个,则将所述映射指令中占用内存空间最小的映射指令确认为控制指令。

例如,最优动词关键词为“打开”,最优名词关键词为“微信”,同时与最优动词关键词和最优名词关键词相匹配的映射指令一共三个,包括:1,打开微信;2,打开微信朋友圈;3,打开微信钱包。在本实施例中,设备对查询三个映射指令各自占用的内存空间。可以明显得出,指令2和指令3都包含有指令1的步骤,因此,指令1所占用的内存空间最小,设备将把映射指令1确认为控制指令。此方案可最大程度作出信息反馈,并且具备可扩展性,用户可在已执行的步骤上进行进一步扩展,从而实现指令2或指令3的步骤。

进一步地,基于第一实施例提出本发明语音控制方法的第三实施例,在本实施例中,所述基于指令分析集映射的模拟点击脚本执行所述有效控制指令的步骤包括:

若检测到所述控制指令为特定控制指令,则在当前显示页面显示时长为预设时间值的时间进度滚动条,并在预设时间值之后基于指令分析集映射的模拟点击脚本执行所述有效控制指令。

可以理解的是,当可穿戴设备的主要控制方式以语音控制为主时,那么也将继承语音控制的缺陷。例如语音控制需要用户发声,而发出语音对用户而言是非常简单的,这也导致语音控制具有一定的语言随意性。假设当前用户本意是想发出“拨打电话给张三”,而因为过于随意导致口误发出“拨打电话给李四”。假设没有纠错机制,用户将无法取消本次错误的语音操控。本实施例提供一种针对特定语音指令的延缓执行机制,以便用户进行及时纠错。其方法为:在检测到特定控制指令时,在设备的当前显示页面显示一个时间进度滚动条,该滚动条显示时长为预设时间值(如2秒),以便用户在下达指令后进行缓冲纠错。

具体地,假设当前指令为“拨打电话给张三”,那么设备感应到“拨打电话给张三”符合特定控制指令“拨打电话给xxx”的特征时,将自动根据特定控制指令的指令模式,在当前显示页面中显示长达3秒的时间进度滚动条,并在3秒之后直接执行“拨打电话给张三”的控制指令。若用户在3秒之内发现拨错联系人时,可通过“取消拨打”的语音指令控制设备取消拨打电话的步骤。

以上例子仅为举例,特定控制指令可包括多种特征,如发短信给xxx,免密支付xxx元等等。

进一步地,基于第三实施例提出本发明语音控制方法的第四实施例,在本实施例中,参照图9,所述方法还包括:

步骤S50,若检测到用户输入的指令自定义指令,则输出所述指令分析集中的所有指令项;

步骤S60,获取基于所有指令项触发的选择指令,并获取所述选择指令对应的待选指令项的指定顺序,所述待选指令项包括多项指令项;

指令分析集中的语音指令项可能缺少用户的个性化指令,用户可进行自定义设置。若检测到用户的指令自定义指令,设备将把分析集中的所有指令项输出,供用户查询编辑。若用户编辑指定其中任意两项以及两项以上的指令项,获取指定顺序。

步骤S70,若检测到所述待选指令项对应的编辑组合指令,则基于所述编辑组合指令按所述指定顺序将所述待选指令项组合为目标指令项,并输出该目标指令项的重命名输入框;

假设用户点击了编辑组合按钮,则根据编辑组合指令按指定顺序对指定的指令项进行组合编辑,以生成目标组合指令。同时,设备提示用户进行目标组合指令的重命名流程。

步骤S80,将基于重命名输入框输入的名称作为目标指令项的指令名称,并将所述目标指令项加入到指令分析集中。

用户进行自定义命名,完成命名后的目标指令项以新名称作为指令名称,并加入到指令分析集中,以扩充指定分析集的分析范围。

具体地,假设用户输入“进入指令自定义设置”的指令自定义指令,设备将输出所有指令项,若用户指定a指令项和b指令项,获取指定顺序1-a,2-b。若用户点击编辑组合指令,则将指令项a,b按顺序进行组合编辑,从而生成目标指令项c(即a+b),同时显示命名框提示用户进行重命名。最后再将完成重命名的目标指令项c加入到指令分析集中。

进一步地,基于第四实施例提出本发明语音控制方法的第五实施例,在本实施例中,所述基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息的步骤之后还包括:

步骤S90,对所述语音信息进行音质识别,以获取该语音信息的音质等级;

所述音质识别指的是对语音信息进行声纹、音量检测。在现实生活中,可穿戴设备和用户可能处于嘈杂环境中,导致设备所获取到的语音信息包含有大量噪音,降低后续的语音指令检测分析的精确度。本实施例通过对获取到的语音信息进行音质识别,以确认该语音信息的音质等级。

具体地,假设用户设备处于菜市场中,用户的语音信息中夹杂有大量菜市场叫卖声等杂音,并且杂音的音量可能盖过用户本身的语音。此时设备采集到的语音信息通过声纹检测和音量检测,将会呈现大量的语音噪点。所述音质等级为设备所设置的音质判定等级,是以检测到的声纹特征和音量特征为基准的综合判定结果。例如,为语音信息设置音损分:在语音信息的声纹中每隔0.1秒钟检测到无序的声纹特征,音损分加1,音质音量特征中每0.1秒检测到一个大于预设值的音量起伏,音损分加1。累计音损总分,并映射到音质识别检测的音质等级判定表上。音质等级从高到低依次为一级,二级和三级。其中音损总分越高,对应的音质等级越低。

以上实施例仅为举例。

步骤S100,若所述音质等级小于预设音质等级,则输出重新输入语音信息的提示信息。

本实施例设置了预设音质等级,若所述音质等级小于预设音质等级,证明当前音质等级不达标,无法被设备有效识别。此时设备间输出重新输入语音信息的提示信息。

本发明还提供一种可穿戴设备,所述可穿戴设备包括:存储器、处理器、通信总线以及存储在所述存储器上的计算机程序:

所述通信总线用于实现处理器和存储器之间的连接通信;

所述处理器用于执行所述计算机程序,以实现上述语音控制方法各实施例的步骤。

本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述语音控制方法各实施例的步骤。

本发明计算机可读存储介质具体实施方式与上述语音控制方法各实施例基本相同,在此不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

技术特征:

1.一种语音控制方法,所述方法应用于可穿戴设备,其特征在于,所述语音控制方法包括:

基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令;

若是,则获取当前显示页面的界面布局,并提取所述界面布局上各个控件的控件信息;

依据所有控件信息检测所述控制指令是否为有效控制指令;

若是,则基于指令分析集映射的模拟点击脚本执行所述有效控制指令。

2.如权利要求1所述的语音控制方法,其特征在于,所述依据预设的指令分析集检测所述语音信息是否为控制指令的步骤包括:

提取语音信息中的所有语音关键词,并确认各语音关键词的关键词属性,所述关键词属性包括动词关键词和名词关键词;

依据预设的指令分析集对所述语音关键词进行权重打分,以获得各语音关键词的权重分;

获取各语音关键词中权重分最高的最优动词关键词和最优名词关键词;

若检测到指令分析集中存在与最优动词关键词和最优名词关键词相匹配的映射指令,则将所述映射指令确认为控制指令。

3.如权利要求2所述的语音控制方法,其特征在于,

所述若检测到指令分析集中存在与最优动词关键词和最优名词关键词相匹配的映射指令,则将所述映射指令确认为控制指令的步骤还包括:

若检测到映射指令不止一个,则将所述映射指令中占用内存空间最小的映射指令确认为控制指令。

4.如权利要求1所述的语音控制方法,其特征在于,所述当前显示页面包括当前页面标识,所述控件信息包括当前控件标识,所述依据所有控件信息检测所述控制指令是否为有效控制指令的步骤包括:

提取所述控制指令中的目标页面标识和目标控件标识;

检测所述当前显示页面上是否存在与目标页面标识映射的当前页面标识,以及所述控件信息是否存在与目标控件标识映射的当前控件标识;

若所述当前显示页面上存在与目标页面标识映射的当前页面标识,且所述控件信息是否存在与目标控件标识映射的当前控件标识,则确认所述控制指令为有效控制指令。

5.如权利要求1所述的语音控制方法,其特征在于,所述基于指令分析集映射的模拟点击脚本执行所述有效控制指令的步骤包括:

若检测到所述控制指令为特定控制指令,则在当前显示页面显示时长为预设时间值的时间进度滚动条,并在预设时间值之后基于指令分析集映射的模拟点击脚本执行所述有效控制指令。

6.如权利要求5所述的语音控制方法,其特征在于,

所述基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令的步骤包括:

若基于预置的语音采集模块检测到专属唤醒指令,则实时获取所述可穿戴设备所处环境的语音信息。

7.如权利要求6所述的语音控制方法,其特征在于,所述方法还包括:

若检测到用户输入的指令自定义指令,则输出所述指令分析集中的所有指令项;

获取基于所有指令项触发的选择指令,并获取所述选择指令对应的待选指令项的指定顺序,所述待选指令项包括多项指令项;

若检测到所述待选指令项对应的编辑组合指令,则基于所述编辑组合指令按所述指定顺序将所述待选指令项组合为目标指令项,并输出该目标指令项的重命名输入框;

将基于重命名输入框输入的名称作为目标指令项的指令名称,并将所述目标指令项加入到指令分析集中。

8.如权利要求1-7所述的语音控制方法,其特征在于,

所述基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令的步骤之后还包括:

对所述语音信息进行音质识别,以获取该语音信息的音质等级;

若所述音质等级小于预设音质等级,则输出重新输入语音信息的提示信息。

9.一种可穿戴设备,其特征在于,所述可穿戴设备包括:

存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;

所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的语音控制方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的语音控制方法的步骤。

技术总结

本申请公开了一种语音控制方法、可穿戴设备和计算机可读存储介质,所述语音控制方法包括:基于预置的语音采集模块实时获取所述可穿戴设备所处环境的语音信息,并依据预设的指令分析集检测所述语音信息是否为控制指令;若是,则获取当前显示页面的界面布局,并提取所述界面布局上各个控件的控件信息;依据所有控件信息检测所述控制指令是否为有效控制指令;若是,则基于指令分析集映射的模拟点击脚本执行所述有效控制指令。本申请解决了如何改善腕机等可穿戴设备的小屏操作体验不友好的技术问题。

技术研发人员:郭红艳

受保护的技术使用者:努比亚技术有限公司

技术研发日:.05.31

技术公布日:.09.03

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。