詳解Android studio實現語音轉文字功能
一、在科大訊飛的官網上註冊並下載SDK
1.首先去訊飛開放平臺申請一個賬號(https://www.xfyun.cn/),然後點擊“控制臺”進入新的頁面,創建一個應用,找到“語音聽寫”,下載相應的SDK。
文件解壓後內容如下:
二、配置安卓項目
1.在android studio中新建一個空項目,將libs文件夾中的內容復制到安卓項目的libs文件夾下,其中msc.jar要右鍵添加Add As Library:
2.將assets文件夾拷貝到項目的main目錄下,並在main目錄下新建一個名為jniLibs的文件夾,將下載的libs文件夾中的兩個子文件夾復制到jniLibs中:
3.在AndriodManifest.xml中添加以下權限:
<!--連接網絡權限,用於執行雲端語音能力 --> <uses-permission android:name="android.permission.INTERNET"/> <!--獲取手機錄音機使用權限,聽寫、識別、語義理解需要用到此權限 --> <uses-permission android:name="android.permission.RECORD_AUDIO"/> <uses-permission android:name="Manifest.permission.RECORD_AUDIO" /> <!--讀取網絡信息狀態 --> <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE"/> <!--獲取當前wifi狀態 --> <uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/> <!--允許程序改變網絡連接狀態 --> <uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/> <!--讀取手機信息權限 --> <uses-permission android:name="android.permission.READ_PHONE_STATE"/> <!--讀取聯系人權限,上傳聯系人需要用到此權限 --> <uses-permission android:name="android.permission.READ_CONTACTS"/> <!--外存儲寫權限,構建語法需要用到此權限 --> <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/> <!--外存儲讀權限,構建語法需要用到此權限 --> <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/> <!--配置權限,用來記錄應用配置信息 --> <uses-permission android:name="android.permission.WRITE_SETTINGS" tools:ignore="ProtectedPermissions" /> <!--手機定位信息,用來為語義等功能提供定位,提供更精準的服務--> <!--定位信息是敏感信息,可通過Setting.setLocationEnable(false)關閉定位請求 --> <uses-permission android:name="android.permission.ACCESS_FINE_LOCATION"/> <!--如需使用人臉識別,還要添加:攝像頭權限,拍照需要用到 --> <uses-permission android:name="android.permission.CAMERA" />
4.在app目錄下的build.gradle中添加以下代碼:
sourceSets { main { jniLibs.srcDirs = ['libs'] } }
5.修改佈局文件activity_main.xml中的代碼:
<?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns:tools="http://schemas.android.com/tools" android:id="@+id/container" android:layout_width="match_parent" android:layout_height="match_parent" tools:context=".MainActivity"> <Button android:id="@+id/btn_click" android:text="點擊打開訊飛語音識別" android:layout_width="wrap_content" android:layout_height="wrap_content" /> <EditText android:id="@+id/result" android:layout_below="@id/btn_click" android:layout_width="match_parent" android:layout_height="wrap_content" android:hint="此處顯示你所錄下的內容" /> </LinearLayout>
6.新建一個名為XunFeiCallbackListener的接口:
package com.example.myapplication; import com.iflytek.cloud.RecognizerResult; public interface XunFeiCallbackListener { void onFinish(RecognizerResult results); }
7.新建一個名為XunFeiUtil的類:
package com.example.myapplication; import android.content.Context; import android.widget.Toast; import com.iflytek.cloud.RecognizerResult; import com.iflytek.cloud.SpeechConstant; import com.iflytek.cloud.SpeechError; import com.iflytek.cloud.SpeechUtility; import com.iflytek.cloud.ui.RecognizerDialog; import com.iflytek.cloud.ui.RecognizerDialogListener; import org.json.JSONArray; import org.json.JSONObject; import org.json.JSONTokener; public class XunFeiUtil { public static String appid = "自己的appid"; public static void initXunFei(Context context){ SpeechUtility.createUtility(context, SpeechConstant.APPID +"="+appid); } public static void startVoice(Context context, final XunFeiCallbackListener callbackListener) { RecognizerDialog dialog = new RecognizerDialog(context,null); dialog.setParameter(SpeechConstant.LANGUAGE, "zh_cn"); dialog.setParameter(SpeechConstant.ACCENT, "mandarin"); dialog.setParameter(SpeechConstant.ASR_PTT, "0"); dialog.setListener(new RecognizerDialogListener() { @Override public void onResult(RecognizerResult recognizerResult, boolean b) { callbackListener.onFinish(recognizerResult); } @Override public void onError(SpeechError speechError) { } }); dialog.show(); //Toast.makeText(this, "請開始說話", Toast.LENGTH_SHORT).show(); } public static String parseIatResult(String json) { StringBuffer ret = new StringBuffer(); try { JSONTokener tokener = new JSONTokener(json); JSONObject joResult = new JSONObject(tokener); JSONArray words = joResult.getJSONArray("ws"); for (int i = 0; i < words.length(); i++) { // 轉寫結果詞,默認使用第一個結果 JSONArray items = words.getJSONObject(i).getJSONArray("cw"); JSONObject obj = items.getJSONObject(0); ret.append(obj.getString("w")); } } catch (Exception e) { e.printStackTrace(); } return ret.toString(); } }
8.修改MainActivity:
package com.example.myapplication; import androidx.appcompat.app.AppCompatActivity; import android.os.Bundle; import android.view.View; import android.widget.Button; import android.widget.EditText; import com.iflytek.cloud.RecognizerResult; import static com.example.myapplication.XunFeiUtil.parseIatResult; import static com.example.myapplication.XunFeiUtil.*; public class MainActivity extends AppCompatActivity implements View.OnClickListener{ private Button btn_click; private EditText mResultText; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_main); initXunFei(this); btn_click = (Button) findViewById(R.id.btn_click); mResultText = ((EditText) findViewById(R.id.result)); btn_click.setOnClickListener(this); } @Override public void onClick(View v) { startVoice(this, new XunFeiCallbackListener() { @Override public void onFinish(RecognizerResult results) { String text = parseIatResult(results.getResultString()); // 自動填寫地址 mResultText.append(text); } }); } }
三、運行效果展示
按照以上操作進行修改,完成後運行項目,會出現語音開啟失敗,錯誤碼為20006的錯誤,出錯原因是android系統在非動態申請權限的情況下,默認是把麥克風權限是關閉瞭的,因此需要打開權限,可以在手機的權限中自己修改權限設置,成功後的界面如下:
以上就是詳解Android studio實現語音轉文字功能的詳細內容,更多關於Android studio語音轉文字的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- Android開發之permission動態權限獲取詳解
- Android應用實現點擊按鈕震動
- Android開發案例手冊Application跳出dialog
- Android廣播實現App開機自啟動
- Android中如何使用Glide加載圖像