语音情绪识别

kamado nezuko

Mar 16, 2024 — 3 min read

做一个记录,方便理清思路

示例代码复现

我按照fastai的指导,第一步完成训练任务的所有步骤,首先我在fastai论坛里找了一个示例

我按照帖子下载了RAVDESS Dataset数据集,但是在下载TESS Dataset数据集时发现老是下载失败,于是我决定先用RAVDESS Dataset数据集进行实验.

我的示例代码中文件是这样命名的

为了方便处理数据,让我的文件结构和示例代码中相同,我决定用chatgpt写一个bash脚本

看起来还不错

接下来我发现示例代码是3年前的项目,很多地方版本不兼容了,与其花时间去修改,不如自己按照示例代码的思路实现快捷.

我怀疑示例代码中的文件已经是图片文件了,刚开始的思路错了,现在在借助fastaudio库处理音频

! [ -e /content ] && pip install -Uqq fastbook # fastai

一个逆天的错误

fastai库直接处理音频不易,决定写脚本转换音频为彩色频谱图,把音频问题直接转换为图片分类问题,结果看起来还不错

这样子之前的示例代码也就没了意义,图像分类是我已经很熟悉的.最后的结果是这样的

代码

bash脚本

数据集

huggingface space

Read more

自建中转节点

落地鸡正常搭建xui面板 x-ui面板实现Vless+reality+tcp+xtls-rprx-vison代理💡docker部署出现了点问题无法解决,改用FranzKafkaYu的脚本 1. 一键安装 bash <(curl -Ls https://raw.githubusercontent.com/FranzKafkaYu/x-ui/master/install.sh) bash <(curl -Ls https://raw.githubusercontent.com/mhsanaei/3x-ui/master/install.sh) 2. 访问ip:端口,在侧边栏转到设置会自动设置根路径,确实任何信息都可以在vps终端输入x-ui重启脚本按7查看 3. 添加一条入站记录 💡x-ui不是通过docker安装,ip不能填172.17.0.1. 如果出现xray内核error,删除最新用户重新添加可解决 4.

四月二十五日

fastai11-Midlevel Data

fastai可以做到5行代码训练一个模型, 这也正是它吸引我的地方 from fastai.text.all import * dls = TextDataLoaders.from_folder(untar_data(URLs.IMDB), valid='test') path = untar_data(URLs.IMDB) dls = DataBlock( blocks=(TextBlock.from_folder(path),CategoryBlock), get_y = parent_label, get_items=partial(get_text_files, folders=['train', 'test']), splitter=

pt刷流

此次尝试是基于github上的这个项目, 还没有试过, 祝我好运吧运行脚本 GitHub - jerry048/Dedicated-SeedboxContribute to jerry048/Dedicated-Seedbox development by creating an account on GitHub.GitHubjerry048💡无语, 我是在nodeseek看到一个问题才想自己试试的, https://www.nodeseek.com/post-80622-1, 帖子里提到要自己安装一系列包, 觉得好麻烦, 然后我呀就按照官网一个个装好了, 运行大佬的一键脚本, 好家伙, 大佬的一键脚本就是一键帮我们安装好这些包的 bash <(wget -qO- https://raw.githubusercontent.com/jerry048/Dedicated-Seedbox/main/Install.sh) -u jerry048 -p 1LDw39VOgors -c