- 编程语言81
- 案例70
- 大数据55
- 中间件48
- 电子书42
- 数据库42
- Go30
- 开源27
- 人工智能25
- CI&CD24
- 软件工程23
- 设计模式23
- Python21
- 数据仓库21
- 任正非20
- Docker20
- 杂项20
- JMeter17
- 微服务15
- 移动端15
- HarmonyOS15
- MySQL15
- Flink14
- 节略章节合辑13
- 软件许可证13
- 原型解构13
- 数据库设计13
- 新零售13
- 分库分表13
- 应用12
- 社交平台12
- 关系推荐12
- 数据科学基础12
- 关于11
- 胡言乱语11
- Linux11
- Clickhouse11
- 集成10
- 原型工具10
- 开发过程10
- Java10
- Spark10
- RocketMQ10
- Axure9
- U-AIGC9
- UI原型9
- Scala8
- Groovy8
- 兼容GPL的许可证8
- 产品经理8
- 智能硬件8
- 大数据风控8
- 爬虫8
- MongoDB8
- Kotlin8
- LUA8
- 程序员的数学7
- 短视频7
- APP7
- Hive7
- 七大设计原则7
- ArkTS7
- GPT6
- API6
- Hadoop6
- HBase6
- 领域模型6
- Kafka6
- Spring Security6
- Java高并发6
- 关于我5
- 开源常识5
- 车联网5
- Redis5
- Aviator5
- Flume5
- Caffeine5
- Google Guava5
- 毛泽东选集4
- 工具4
- 特色农产品4
- 文档许可证4
- 自由文档许可证4
- 其他许可证4
- 可穿戴产品4
- 流水线4
- Elasticsearch4
- Neo4j4
- 技术论文3
- 我写的书3
- 跑腿闪送3
- 设计心理学3
- 分布式3
- Android3
- 不兼容GPL的许可证3
- 电商3
- PC端3
- Apache Commons3
- Drools2
- 非自由软件许可证2
- 用户研究2
- 个人爱好1
- 个人能力1
- 超级个体1
- 第一卷1
- AIGC1
- 视觉交互设计1
- 数学1
- 站点部署1
- 智能穿戴1
- Balsamiq Mockups1
- Apache1
- AB压测1
- 第二卷1
- 第三卷1
- 第四卷1
- captcha1
- FaceRecognition1
- 地图1
- OSS1
- 支付1
- PUSH1
- OAuth 2.01
- SMS1
- weather1
- 综合性交互设计1
- 复杂设计1
- 情感设计1
- 云原生1
- 全局唯一ID1
- 幂等性1
- 事务1
- 瀑布模型1
- Azkaban1
- Canal1
- FileBeat1
- Sqoop1
- Zepplin1
- Lua1
- 加密算法1
- SSL1
- TLS1
- CA证书1
- HTTPS1
- Spring AI1
- 用户体验五要素1
- UFD分析法1
- 产品类型1
- 盈利模式1
- 可行性判断1
- 定价策略1
- 黑盒测试1
- 灰度测试1
- AB测试1
- PEST1
- SWOT1
- MRD1
- PRD1
- KANO模型分析1
- 需求价值分析1
- 车机交互1
- 分布式事务1
- Matplotlib1
- Pandas1
- Numpy1
- Scipy1
- Impala1
- 合成复用原则1
- 迪米特法则1
- 依赖反转原则1
- 接口隔离原则1
- 里氏替换原则1
- 开闭原则1
- 单一职责原则1
- 敏捷过程1
- RUP1
- UML1
- ERD1
- ElasticSearch1
- Cangjie1
- Cache1
- EventBus1
- common-fileupload1
- commons-lang31
原创大约 2 分钟
数字人最开始是用于代替主播实现全天候无人值守,2023年的时候就有了腾讯智影,它应该是国内在这方面做的比较早的的应用之一。
其实只要会用剪辑软件,生成一个数字人就是分分钟的事。
从图上可以看出,这完全就是在线版的剪辑软件。所有的内容,从文本、视频、背景、语音、字幕,再到素材、工具,几乎和剪辑软件没有区别。
原创大约 2 分钟
软件变声
要说到音视频方面的应用,不得不提起老牌的ffmpeg——这绝对是多媒体领域泰山北斗一般的存在,几乎所有和音视频处理相关的软件都离不开它的支持。
大多数的音视频播放、处理软件其实都是对它的功能的封装。
# 抽取音频命令
ffmpeg -i test.mp4 -vn -y -acodec copy result.aac
ffmpeg -i test.mp4 -vn -y -acodec copy result.m4a
# 提取视频 (Extract Video)
ffmpeg -i test.mkv -vcodec copy –an test.mp4
# 音视频合成命令
ffmpeg -i video.avi -i audio.mp3 -vcodec copy -acodec copy output.avi
# ffmpeg分离出PCM数据
ffmpeg -i test.mp4 -ar 44100 -ac 2 -f s16le output.pcm
# ffmpeg去除视频水印
# -vf delogo 表示使用ffmpeg中去水印的滤镜
# x=?:y=?:w=?:h=?:show=? 表示delogo滤镜的参数
# x,y 表示去除水印范围在视频中的起始坐标,w,h表示所选的区域的宽高,show表示是否显示矩形框,0表示不显示,1表示显示
ffmpeg -i test.mp4 -vf delogo=x=?:y=?:w=?:h=?:show=? out.mp4
原创大约 3 分钟
在AI应用领域,如果说除了ChatGPT和Midjourney应用之外,还有什么应用可以用极为火爆
来形容的话,那么非换脸
莫属!
原创大约 5 分钟
原创大约 4 分钟
相对于文生文、文生图这两类,视频领域的AI类应用就少多了。
目前在文生视频领域,领跑的是Sora和Stable Video,以及曾经默默无闻的Runway,不知道为什么Midjourney反而没声响了。
原创大约 11 分钟
虽然有一些图像生成应用很早就出现了,例如2015年谷歌发布DeepDream,同年出现的Neural Style Transfer,2016年出现的DCGAN,以及加州大学伯克利分校在2017年发布的Pix2Pix和CycleGAN等。
原创大约 4 分钟
如果没有鼠标键盘,人们就无法输入需要计算机处理的数据,也就与计算机进行快速有效地交互。对于AI来说,Prompt(提示词)就是它的鼠标和键盘,是一种用于和人工智能进行有效交互的指导性文本。通过Prompt,可以让那些绘画的大模型按照我们的想法生成图像。
原创大约 16 分钟