相信我们大家在刚开始学习一门语言的时候都有过听写,现在的小学生学语文的时候一项重要的课后作业就是听写课文中的生词,很多家长们都有这方面的经历。不过一方面这种读单词的动作相对简单,另一方面家长的时间也很宝贵,现在市场上出现了很多xx课后听写的语音,这些播讲人将语文教材上的课后听写单词录好,给家长下载使用,不过这种录音不够灵活,如果老师今天额外留了几道不是课后习题中的单词,这部分的录音就不能满足家长和孩子们的需要。本文就介绍了一个使用我们ML kit 的通用文本识别功能和语音合成功能共同实现自动语音播报APP,只需要对听写的单词或者课文拍照,然后就能自动播报照片中的文字,播报的音色、音调都可以调整。

在这里插入图片描述


在这里插入图片描述
  在allprojects ->repositories里面配置HMS SDK的maven仓地址

  1. allprojects {
  2. repositories {
  3. google()
  4. jcenter()
  5. maven {url \'http://developer.huawei.com/repo/\'}
  6. }
  7. }

  在buildscript->repositories里面配置HMS SDK的maven仓地址

  1. buildscript {
  2. repositories {
  3. google()
  4. jcenter()
  5. maven {url \'http://developer.huawei.com/repo/\'}
  6. }
  7. }

  在buildscript->repositories里面配置HMS SDK的maven仓地址

  1. buildscript {
  2. repositories {
  3. google()
  4. jcenter()
  5. maven {url \'http://developer.huawei.com/repo/\'}
  6. }
  7. }

  在buildscript->dependencies中,配置AGC插件

  1. dependencies {
  2. classpath \'com.huawei.agconnect:agcp:1.2.1.301\'
  3. }

  打开应用级的build.gradle文件

在这里插入图片描述

  集成SDK

  1. dependencies{
  2. implementation \'com.huawei.hms:ml-computer-voice-tts:1.0.4.300\'
  3. implementation \'com.huawei.hms:ml-computer-vision-ocr:1.0.4.300\'
  4. implementation \'com.huawei.hms:ml-computer-vision-ocr-cn-model:1.0.4.300\'
  5. }

  应用ACG插件,添加在文件头即可

  1. apply plugin: \'com.huawei.agconnect\'

  指定权限和特性:在AndroidManifest.xml中进行声明

  1. <uses-permission android:name="android.permission.CAMERA" />
  2. <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE" />
  3. <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
  4. <uses-feature android:name="android.hardware.camera" />
  5. <uses-feature android:name="android.hardware.camera.autofocus" />

  作业朗读代码关键步骤

  主要有两个功能,一个是识别作业文本,一个是朗读作业,通过OCR+TTS实现作业朗读,拍照后点击播放即可朗读。

  1. 动态权限申请
  1. private static final int PERMISSION_REQUESTS = 1;
  2. @Override
  3. public void onCreate(Bundle savedInstanceState) {
  4. // Checking camera permission
  5. if (!allPermissionsGranted()) {
  6. getRuntimePermissions();
  7. }
  8. }
  1. 启动朗读界面
  1. public void takePhoto(View view) {
  2. Intent intent = new Intent(MainActivity.this, ReadPhotoActivity.class);
  3. startActivity(intent);
  4. }
  1. 在onCreate()法中调用createLocalTextAnalyzer()创建端侧文本识别器
  1. private void createLocalTextAnalyzer() {
  2. MLLocalTextSetting setting = new MLLocalTextSetting.Factory()
  3. .setOCRMode(MLLocalTextSetting.OCR_DETECT_MODE)
  4. .setLanguage("zh")
  5. .create();
  6. this.textAnalyzer = MLAnalyzerFactory.getInstance().getLocalTextAnalyzer(setting);
  7. }
  1. 在onCreate()法中调用createTtsEngine ()创建语音合成引擎,并构建语音合成回调,用于处理语音合成结果,将语音合成回调传入新建的语音合成引擎中
  1. private void createTtsEngine() {
  2. MLTtsConfig mlConfigs = new MLTtsConfig()
  3. .setLanguage(MLTtsConstants.TTS_ZH_HANS)
  4. .setPerson(MLTtsConstants.TTS_SPEAKER_FEMALE_ZH)
  5. .setSpeed(0.2f)
  6. .setVolume(1.0f);
  7. this.mlTtsEngine = new MLTtsEngine(mlConfigs);
  8. MLTtsCallback callback = new MLTtsCallback() {
  9. @Override
  10. public void onError(String taskId, MLTtsError err) {
  11. }
  12. @Override
  13. public void onWarn(String taskId, MLTtsWarn warn) {
  14. }
  15. @Override
  16. public void onRangeStart(String taskId, int start, int end) {
  17. }
  18. @Override
  19. public void onEvent(String taskId, int eventName, Bundle bundle) {
  20. if (eventName == MLTtsConstants.EVENT_PLAY_STOP) {
  21. if (!bundle.getBoolean(MLTtsConstants.EVENT_PLAY_STOP_INTERRUPTED)) {
  22. Toast.makeText(ReadPhotoActivity.this.getApplicationContext(), R.string.read_finish, Toast.LENGTH_SHORT).show();
  23. }
  24. }
  25. }
  26. };
  27. mlTtsEngine.setTtsCallback(callback);
  28. }
  1. 设置读取照片、拍照和朗读按钮
  1. this.relativeLayoutLoadPhoto.setOnClickListener(new View.OnClickListener() {
  2. @Override
  3. public void onClick(View v) {
  4. ReadPhotoActivity.this.selectLocalImage(ReadPhotoActivity.this.REQUEST_CHOOSE_ORIGINPIC);
  5. }
  6. });
  7. this.relativeLayoutTakePhoto.setOnClickListener(new View.OnClickListener() {
  8. @Override
  9. public void onClick(View v) {
  10. ReadPhotoActivity.this.takePhoto(ReadPhotoActivity.this.REQUEST_TAKE_PHOTO);
  11. }
  12. });
  1. 在拍照和读取照片的回调当中启动文本识别startTextAnalyzer()
  1. private void startTextAnalyzer() {
  2. if (this.isChosen(this.originBitmap)) {
  3. MLFrame mlFrame = new MLFrame.Creator().setBitmap(this.originBitmap).create();
  4. Task<MLText> task = this.textAnalyzer.asyncAnalyseFrame(mlFrame);
  5. task.addOnSuccessListener(new OnSuccessListener<MLText>() {
  6. @Override
  7. public void onSuccess(MLText mlText) {
  8. // Transacting logic for segment success.
  9. if (mlText != null) {
  10. ReadPhotoActivity.this.remoteDetectSuccess(mlText);
  11. } else {
  12. ReadPhotoActivity.this.displayFailure();
  13. }
  14. }
  15. }).addOnFailureListener(new OnFailureListener() {
  16. @Override
  17. public void onFailure(Exception e) {
  18. // Transacting logic for segment failure.
  19. ReadPhotoActivity.this.displayFailure();
  20. return;
  21. }
  22. });
  23. } else {
  24. Toast.makeText(this.getApplicationContext(), R.string.please_select_picture, Toast.LENGTH_SHORT).show();
  25. return;
  26. }
  27. }
  1. 识别成功后,点击播放按钮即可开始播放
  1. this.relativeLayoutRead.setOnClickListener(new View.OnClickListener() {
  2. @Override
  3. public void onClick(View v) {
  4. if (ReadPhotoActivity.this.sourceText == null) {
  5. Toast.makeText(ReadPhotoActivity.this.getApplicationContext(), R.string.please_select_picture, Toast.LENGTH_SHORT).show();
  6. } else {
  7. ReadPhotoActivity.this.mlTtsEngine.speak(sourceText, MLTtsEngine.QUEUE_APPEND);
  8. Toast.makeText(ReadPhotoActivity.this.getApplicationContext(), R.string.read_start, Toast.LENGTH_SHORT).show();
  9. }
  10. }
  11. });

在这里插入图片描述


往期链接:超简单集成HMS Scan Kit扫码SDK,轻松实现扫码购
原文链接:https://developer.huawei.com/consumer/cn/forum/topicview?tid=0201283755975150303&fid=18
原作者:littlewhite

版权声明:本文为developer-huawei原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/developer-huawei/p/13212552.html