Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

考虑基于cpp实现addon给node调用实现autocut功能吗 #16

Open
chenqianhe opened this issue Jan 10, 2023 · 10 comments
Open

考虑基于cpp实现addon给node调用实现autocut功能吗 #16

chenqianhe opened this issue Jan 10, 2023 · 10 comments
Labels
help wanted Extra attention is needed

Comments

@chenqianhe
Copy link

目前whisper的cpp推理已经有了,我最近把vad的cpp推理也实现了,而且我觉得纯cpu运行whisper的时间也是能够接受的,所以有考虑直接基于cpp来实现autocut的功能给node调用实现client吗?
这样的效率应该也会更高并且可以完整打包,减少使用过程中去安装别的依赖。

@chenqianhe chenqianhe added the help wanted Extra attention is needed label Jan 10, 2023
@zcf0508
Copy link
Owner

zcf0508 commented Jan 10, 2023

@chenqianhe 很好的提议,如果能完成「基于cpp来实现autocut」的任务,那我觉得是没什么问题的。

客户端的功能和 autocut 是一致的,就是「生成字幕」「编辑字幕」「合成视频」,如果前两个都能够用 cpp 实现,那只要再把最后一个合成的任务解决就可以。不过我对于 cpp 和 ffmpeg 的开发都不是很熟悉,如果有人能够帮忙的话是最好的。

另外,我目前在考虑额外提供一个服务端程序,让不方便使用本机转录的同学可以用服务器来处理视频,应该会比使用本机更方便快速一些。

@chenqianhe
Copy link
Author

@chenqianhe 很好的提议,如果能完成「基于cpp来实现autocut」的任务,那我觉得是没什么问题的。

客户端的功能和 autocut 是一致的,就是「生成字幕」「编辑字幕」「合成视频」,如果前两个都能够用 cpp 实现,那只要再把最后一个合成的任务解决就可以。不过我对于 cpp 和 ffmpeg 的开发都不是很熟悉,如果有人能够帮忙的话是最好的。

另外,我目前在考虑额外提供一个服务端程序,让不方便使用本机转录的同学可以用服务器来处理视频,应该会比使用本机更方便快速一些。

cpp开发不是难题,主要是addon是基于node-gyp方案,这个编译cpp生成node接口我不太熟。

服务端感觉一是成本太高了,不管是gpu服务器还是cpu服务器;二是对用户来说数据安全不可控。不过要开发的话我可以帮忙一起,这个能搞定。

不过还是感觉优化客户端可能更合适,我这边测过一些large模型cpu跑四十多分钟的视频大概是1.2到1.5倍的耗时,这对于视频创作和编辑来说是完全可以接受的时长。

@chenqianhe
Copy link
Author

@zcf0508 新年快乐!祝新的一年不写 BUG!!!
顺带 VAD-addon 开发完成,预祝新的一年能做出做出更好的开源项目!

@chenqianhe
Copy link
Author

whisper 的 addon

ggerganov/whisper.cpp#443

@chenqianhe
Copy link
Author

@zcf0508
Copy link
Owner

zcf0508 commented Feb 2, 2023

@chenqianhe 新年好,非常感谢你对这个项目的支持!

目前我在尝试使用 python 配合 webview 的方式来进行开发,这样后端可以直接使用 python 相关的库,避免需要将三方库打包成可执行文件或者需要预先编译为 addon 的问题。

不知道你对这个有什么看法,如果你也感兴趣的可以,可以看下这个项目。

https://github.com/zcf0508/clip-wizard

这个项目目前刚搭建好,还没有实际的功能,计划采用 CS 模式。程序启动时会运行一个后端服务,提供api接口和静态资源的服务,通过webview来显示页面。前端通过 http 调用服务端来处理相关内容,服务端直接使用 python 来编写。

这样如果后期考虑需要集成其它的 AI 模型,阻力应该会小很多。

@chenqianhe
Copy link
Author

确实 CS 的模式更好实现,可以试试看。而且 python 服务打包现在也不难实现了。

@laorange

This comment was marked as off-topic.

@henglei1228
Copy link

henglei1228 commented Feb 12, 2023 via email

@zcf0508 zcf0508 reopened this Sep 20, 2023
@henglei1228
Copy link

henglei1228 commented Sep 20, 2023 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
help wanted Extra attention is needed
Projects
None yet
Development

No branches or pull requests

4 participants