从 Apify到 Notion:如何利用make实现自动化Youtube视频采集

  Рет қаралды 1,390

翔宇工作流

翔宇工作流

Күн бұрын

Пікірлер: 22
@xiangyugongzuoliu
@xiangyugongzuoliu 4 ай бұрын
翔宇工作流的小报童专栏上线啦!获取30个视频工作流源文件、专属社群支持、错误排查指南等内容。限时8折优惠,过期恢复原价,赶快行动!
@BenyeDaotzu
@BenyeDaotzu 4 ай бұрын
up主 太棒了,非常有帮助,很喜欢自动化工作流的内容,加油!会一直支持!!
@xiangyugongzuoliu
@xiangyugongzuoliu 4 ай бұрын
感谢支持!
@mulee-p6p
@mulee-p6p 2 ай бұрын
每天都来学一个
@xiangyugongzuoliu
@xiangyugongzuoliu 2 ай бұрын
🤝
@GavinCH-p5j
@GavinCH-p5j 5 ай бұрын
您好,有2個問題請教您: 在16:30的影片中,NOTION 設定content欄位中的"subtitle[ ]:SRT",我在Apify4找到的只有"subtitle",沒有下拉選單可以mapping到"SRT",因此不斷報錯->[400] body 驗證失敗:body.children[0].paragraph.rich_text[0].text.content 應該是字串,而不是 `[ ]`。 2. 在"create a database item moudle中,Fields設定中,沒有出現"發布時間"、"創建時間"和"更新時間"的field可以mapping,前面的moudle設定程序完全相同,請問問題原因與解決方案為何? 謝謝!
@xiangyugongzuoliu
@xiangyugongzuoliu 5 ай бұрын
视频17分钟涉及到相关的了,需要原视频存在自制字幕,采集才能获取,视频本身没有字幕则无法采集到,需要添加音频转文字的模块自己生成一下。另外字幕不推荐放置在notion的属性中,字幕太长也会造成报错,把字幕添加到附录中。第二个问题,需要自己在notion根据字幕选项把这些属性新建一下,才能在make出现这些field。
@GavinCH-p5j
@GavinCH-p5j 4 ай бұрын
@@xiangyugongzuoliu 感謝您!!
@阿賀菈
@阿賀菈 3 ай бұрын
照著視頻的步驟不知道是哪個步驟流程做錯,重做了幾次,都只有採集到一次的數據而已,沒像您的視頻中有兩個頻道的數據,可能是哪個環節出錯了呢
@xiangyugongzuoliu
@xiangyugongzuoliu 3 ай бұрын
单个频道数据也行,克隆这个工作流,更换为另一个频道链接就行,也可以正常使用
@shakechen7944
@shakechen7944 4 ай бұрын
对着视频完成了第三个工作流。遇到的小问题就是视频描述超过2k,无法写入notion,只能append到notion上。
@xiangyugongzuoliu
@xiangyugongzuoliu 4 ай бұрын
这个只能放到附录里了,属性栏最高只支持2000字,附录里面没记错的的话是4000字。这属于官方notion的api的限制。
@shakechen7944
@shakechen7944 4 ай бұрын
@@xiangyugongzuoliu 工作流说明 1. Tools-Basic trigger:make官方提供的触发器,填写网址,这里如果天然多个Items,就是多个网址链接,后面是需要加入Iterator 2. Iterator:如果前面触发器是1个地址,或者一个参数,这个是不需要的,多个参数,需要加上,逐一传递给后面。 3. Apify-Run an Actor: Apify是一个数据爬虫工具网站,提供各种网站的爬虫,收费网站,提供免费额度。我们需要使用的youtube的爬虫,创建一个youtube的Actors,make里设置Apify的Actors的爬虫参数。爬虫参数,为了格式美观,jsonformatter.org/ 网站把参数转换成格式精美 4. Apify-Get Dataset items: 获取前面Apify的数据。采用JSON格式输出。 5. Text parser-Replace: 这一步是我加上: ["{}\[\]\\ ],主要是某些视频描述过长,通过这个过滤掉无效的字符。在这个工作流里,因为有的视频的描述超过2000字符,导致无法写入,只能append 到 notion的主题里。 6. Notion-Create Database item:把抓回来的数据都写入notion, 7. Notion-Append Database item content: 把字幕和视频描述,附加到主题上,没有字数的限制。 总结 1. 视频本身没有字幕,append 字幕阶段就会出错,要避免出错,设置好过滤。要求字幕必须存在,才会进入下一步的notion append动作。 2. notion的文本有2k字符限制,视频描述可能超过2k,简单的处理,也是append 主题上。 3. 抓取的内容,有封面照片,画廊方式展示,非常时髦 4. Apify可以深入看看,其他的爬虫方向
@AllisonZhang-m2j
@AllisonZhang-m2j 6 ай бұрын
测试了一下,为什么有的频道抓取不了?我试着抓取www.youtube.com/@Doctorly 这个频道,然后我发现output不了数据出来
@AllisonZhang-m2j
@AllisonZhang-m2j 6 ай бұрын
重新测试了一下,如果点击主页,然后link变成www.youtube.com/@Doctorly/featured,就能抓取成功了~
@xiangyugongzuoliu
@xiangyugongzuoliu 6 ай бұрын
嗯,这个可以现在 apify 上抓取测试一下
@AllisonZhang-m2j
@AllisonZhang-m2j 6 ай бұрын
@@xiangyugongzuoliu 很奇怪,有的时候可以,有的时候不行,但是抓取单个视频的话都没有问题,另外一个就是如果视频内容过长,不够Token处理有办法解决吗?或者是我链接两个ChatGPT一个处理视频总结,一个处理视频脚本英转中,但是只能处理一个,总会显示Token不足。
@xiangyugongzuoliu
@xiangyugongzuoliu 6 ай бұрын
Token 的问题可以找 kimi 那期视频看看,利用 128k 的长文本来解决。
@xiangyugongzuoliu
@xiangyugongzuoliu 6 ай бұрын
{ "dateFilter": "month", "downloadSubtitles": true, "hasCC": false, "hasLocation": false, "hasSubtitles": false, "is360": false, "is3D": false, "is4K": false, "isBought": false, "isHD": false, "isHDR": false, "isLive": false, "isVR180": false, "lengthFilter": "between420", "maxResultStreams": 0, "maxResults": 5, "maxResultsShorts": 0, "preferAutoGeneratedSubtitles": false, "saveSubsToKVS": true, "sortingOrder": "date", "startUrls": [ { "url": "www.youtube.com/@Doctorly/videos" } ], "subtitlesLanguage": "en", "videoType": "video", "subtitlesFormat": "srt" }
从 RSS 到 Notion:如何利用make实现自动更新知识库
27:57
使用 Dify 工作流 | 10 分鐘打造高效 AI 客服系統!(附 CC 字幕)
10:57
凱文大叔AI程式教學
Рет қаралды 6 М.
Sigma Kid Mistake #funny #sigma
00:17
CRAZY GREAPA
Рет қаралды 30 МЛН
Mom Hack for Cooking Solo with a Little One! 🍳👶
00:15
5-Minute Crafts HOUSE
Рет қаралды 23 МЛН
СИНИЙ ИНЕЙ УЖЕ ВЫШЕЛ!❄️
01:01
DO$HIK
Рет қаралды 3,3 МЛН
Sigma Kid Mistake #funny #sigma
00:17
CRAZY GREAPA
Рет қаралды 30 МЛН