Python模块---制作属于自己的有声小说

利用python的第三方模块制作有声小说

操作环境

Python版本： anaconda3 python3.7.4
操作系统： Ubuntu19.10
编译器： pycharm社区版
用到的模块： pyttsx3，requests

pysstx3模块介绍

pyttsx3官网地址
pyttsx3（Text to Speech）是一个语音转换模块，它可以在离线的环境下工作，支持多个引擎，而且兼容于Python2和Python3.

首先下载pyttsx3模块

pip install pyttsx3

（Windows系统）若你没有安装pywin32模块，则还需安装此模块作为pyttsx3模块的依赖
安装pywin32

pip install pywin32

这个模块很奇怪，下载的过程中经常会报错，试了几台电脑和不同操作系统的结果也是一样，在检查网络和其他因素无误后多试几次就可以成功安装此模块.
安装成功提示如下图

注意：这个模块运行必须在python3.7.4版本及以下才可以运行，否则会由于版本过高报错
如果不知道自己的Python版本是多少，可以再终端输入，输出的第一行就是目前使用的Python版本号

测试pyttsx3库

根据官网给出的简单示范，我们可以测试一下是否可以使用本模块
测试代码：

import pyttsx3

engine = pyttsx3.init()
engine.say("I will speak this text")
engine.runAndWait()

若可以听到一个男声快速的说了一遍我们引用的句子，则证明本模块安装已经成功

自定义修改朗读的语调、音色等参数

也是参照官方文档，将这些参数调整成一个比较舒服的状态

import pyttsx3

engine = pyttsx3.init() # 创建对象

""" 语速 """
rate = engine.getProperty('rate')   # 获取当前语速（默认值）
print (rate)                        # 打印当前语速（默认值）
engine.setProperty('rate', 175)     # 设置一个新的语速


"""音量"""
volume = engine.getProperty('volume')   # 获取当前的音量 （默认值）(min=0 and max=1)
print (volume)                          # 打印当前音量（默认值）
engine.setProperty('volume',1.0)    # 设置一个新的音量（0 < volume < 1）

"""音色"""
voices = engine.getProperty('voices')       # 获取当前的音色信息
engine.setProperty('voice', voices[0].id)  # 改变中括号中的值,0为男性,1为女性

engine.say("Hello World!")
engine.runAndWait()
engine.stop()

在Windows系统中，这一段代码已经可以通过pyttsx3模块说出中文了，但是在Linux操作系统中，还需要修改一个参数

engine.setProperty('voice','zh')             //将音色中修改音色的语句替换

开始制作有声小说

通过刚才对pyttsx模块的讲解，我们已经可以了解到该模块的基本原理以及各个参数所代表的含义，接下来我们就以pyttsx3模块为基础构建一个简单的有声小说.

基本思路

使用爬虫requests模块将小说文本从从网上下载到本地，并将内容保存在一个文本文件中，然后打开文本文件，调用pyttsx3模块对文字进行识别，并朗读出来.

操作步骤

首先找到一个小说网站（我选择的是新笔趣阁小说网因为这个网站没有设置反爬机制比较适合我们练手）
然后随便找到一个小说，进入它的目录页，借助谷歌浏览器的插件xpath helper利用xpath语法提取到每一章小说

点进小说的内容页，同样利用插件提取到内容

然后就可以开始构建爬取小说的代码了
为了节省时间，我先简单的爬取一个章节

import requests
from lxml import etree

def main():
    #小说的详情页
    url = 'http://www.xbiquge.la/10/10489/'
    #请求内容
    response = requests.get(url).text
    #转化成xpath语法可以提取的形式
    html = etree.HTML(response)
    #提取小说内容页的网址
    data = html.xpath("//div[@class='box_con'][2]/div[@id='list']/dl/dd/a/@href")
    #为了节省时间,先只提取一个章节的内容
    sound = data[1]
    #构造小说内容页的网址
    new_url = 'http://www.xbiquge.la' + str(sound)
    #请求
    response_1 = requests.get(new_url).content
    html_1 = etree.HTML(response_1)
    data_1 = html_1.xpath("//div[@id='content']/text()")
    #用replace方法将提取到文本中的\xa0替换掉
    noval = str(data_1).replace('\\xa0', '')
    #替换掉\r
    noval_1 = noval.replace("\\r',", '')
    #将爬取到的小说内容存储到文本文件中
    with open('xiaoshuo.txt','w') as f:
        f.write(noval_1)

if __name__ == '__main__':
     main()

运行完成之后，就可以发现当前文件夹下多出了一个名为xiaoshuo.txt的文件，这就是我们爬取到的小说内容

导入有声阅读模块

def say(filename='xiaoshuo.txt'):
    with open(filename, 'r') as f:
        line = f.read()
        engine = pyttsx3.init()
        engine.setProperty('volume',1.0)
        engine.setProperty('rate', 175)
        engine.setProperty('voice', 'zh')
        engine.say(line)
        engine.runAndWait()

最后再设置一个可以选择章节的接口传入主函数，运行程序即可听到有声小说的内容

完整代码

import requests
from lxml import etree
import pyttsx3

def main(a):
    #小说的详情页
    url = 'http://www.xbiquge.la/10/10489/'
    #请求内容
    response = requests.get(url).text
    #转化成xpath语法可以提取的形式
    html = etree.HTML(response)
    #提取小说内容页的网址
    data = html.xpath("//div[@class='box_con'][2]/div[@id='list']/dl/dd/a/@href")
    #为了节省时间,先只提取一个章节的内容
    sound = data[int(a)]
    #构造小说内容页的网址
    new_url = 'http://www.xbiquge.la' + str(sound)
    #请求
    response_1 = requests.get(new_url).content
    html_1 = etree.HTML(response_1)
    data_1 = html_1.xpath("//div[@id='content']/text()")
    #用replace方法将提取到文本中的\xa0替换掉
    noval = str(data_1).replace('\\xa0', '')
    #替换掉\r
    noval_0 = noval.replace("\\r',", '')
    noval_1 = noval_0.replace('[', '')
    #将爬取到的小说内容存储到文本文件中
    with open('xiaoshuo.txt','w') as f:
        f.write(noval_1)

def say(filename='xiaoshuo.txt'):
    with open(filename, 'r') as f:
        line = f.read()
        engine = pyttsx3.init()
        engine.setProperty('volume',1.0)
        engine.setProperty('rate', 175)
        engine.setProperty('voice', 'zh')
        engine.say(line)
        engine.runAndWait()

if __name__ == '__main__':
    a = input('输入想要朗读的章节（数字）：')
    main(a)
    say()

本文链接：https://www.cnblogs.com/cherish-hao/p/12690637.html