どれが良い?PDF読み取りツール(LlamaParse, Unstructured, FireCrawl)比較してみた

  Рет қаралды 10,082

にゃんたのAIチャンネル

にゃんたのAIチャンネル

Күн бұрын

Пікірлер: 25
@aivtuber2866
@aivtuber2866 5 ай бұрын
Sonnet3.5の速報は 痛恨の外出中で撮れませんでしたっ‥! (期待していた方申し訳ないです🙇)
@shintarooashi1045
@shintarooashi1045 5 ай бұрын
複雑なPDFを読み取るのは、marpやAzureのdocument-intelligenceもいい感じなので、使ってます。
@aivtuber2866
@aivtuber2866 5 ай бұрын
ありがとうございます! 他の方からも教えていただきましたが document-intelligenceいい感じなんですね😲 marpは知らなかったので調べてみます!ありがとうございます!
@shintarooashi1045
@shintarooashi1045 5 ай бұрын
すみません。PDFを読み取るのは、marpではなく、markerでした。
@riho-u5g
@riho-u5g 5 ай бұрын
AzureのDocument Intelligenceを使ってますが、セマンティックチャンキングや表をマークダウンに変換したりして、割と精度が上がってる感があります。
@aivtuber2866
@aivtuber2866 5 ай бұрын
Document Intelligence今回紹介してなかったのですが 精度良い感じになってるんですね😲 教えていただき、ありがとうございます!
@patoru_patr
@patoru_patr 5 ай бұрын
見たかった検証!画面右側の出力結果はなんというツールで表示させていますか? 官公庁の資料は列のラベルが縦書になっていることが多いので困っていましたがファイアークロールはいけるのですね。 Azure Form Recognizerとかも使えますよね。
@aivtuber2866
@aivtuber2866 5 ай бұрын
ありがとうございます! 右側は、GitHubでMarkdown形式のファイルを作成して表示させてます! Azure Form Recongnizerというサービスがあるんですね😲 AzureのサービスAzureOpenAI以外ノータッチだったので、少し調べてみます! ありがとうございます😄
@soladona4228
@soladona4228 5 ай бұрын
いつもありがとうございます!会社で使うとなるとオープンソースじゃないとハードル高いですね。。。
@soladona4228
@soladona4228 5 ай бұрын
Azureみたいにエンタープライズ向けのサービスであれば普通に使えそうです。
@aivtuber2866
@aivtuber2866 5 ай бұрын
@@soladona4228 コメントありがとうございます! 確かに会社の規則的に大手のベンダーじゃないと 導入のハードル高いですよね😢
@Radioman0990
@Radioman0990 3 ай бұрын
PDFに対応したAIを開発するのより、PDFを禁止するほうが筋がいい気がしてた 数年前までは
@mjolnir501
@mjolnir501 3 ай бұрын
あまり関係ないですが、行政資料 markdownでつくること義務付けたら国力あがりそうとか妄想しました。
@aivtuber2866
@aivtuber2866 3 ай бұрын
確かに複雑なPDF自体が無くなったら一番良いですね・・・!🤔
@tamorika111
@tamorika111 5 ай бұрын
投稿ありがとうございます!firecrawlでどうやったらpdf読めるかの動画是非おねがいします!!!サイト見てもwebscrapeだけしかわからず、、
@aivtuber2866
@aivtuber2866 4 ай бұрын
ありがとうございます!(返信遅れました🙇‍♂️) > firecrawlでどうやったらpdf読めるかの動画是非おねがいします!! こちらは、動画で説明できておらずすみません・・・! 単純に公開ページであったのでURLを入力して抽出しています🙇‍♂️ ローカルでできる方法があったら(OSS版だとできる?)紹介したいと思います!
@tamorika111
@tamorika111 4 ай бұрын
@@aivtuber2866 ご返信ありがとうございます!なるほど!コメントにあるazure系試してみます!
@山田太郎-y5f3n
@山田太郎-y5f3n 29 күн бұрын
PDFに写真がある場合difyを使ってPDFの写真も出力したりできますか?
@aivtuber2866
@aivtuber2866 23 күн бұрын
恐らく現在のDifyだとPDFのテキスト情報しか 抽出できないのではないかと思います・・・!🥲
@山田太郎-y5f3n
@山田太郎-y5f3n 22 күн бұрын
最近勉強し始めました!とてもわかりやすいです!ありがとうございます!写真データをネットにアップロードしてリンクでテキスト化するとかが今のやり方かもですね
@aivtuber2866
@aivtuber2866 22 күн бұрын
ありがとうございます!😊 昨日claudeからPDFの画像を読み取れるような機能がリリースされたので、Difyでもすぐできるようになるかもしれません!
@kyakyakua
@kyakyakua 5 ай бұрын
firecrowl(OS版)をどうやってdifyと連携するか教えて欲しいです…!
何が凄いのか?最新の技術GraphRAGについて解説してみた
25:18
にゃんたのAIチャンネル
Рет қаралды 48 М.
Accompanying my daughter to practice dance is so annoying #funny #cute#comedy
00:17
Funny daughter's daily life
Рет қаралды 12 МЛН
БУ, ИСПУГАЛСЯ?? #shorts
00:22
Паша Осадчий
Рет қаралды 2,9 МЛН
Каха и лужа  #непосредственнокаха
00:15
風船をキャッチしろ!🎈 Balloon catch Challenges
00:57
はじめしゃちょー(hajime)
Рет қаралды 95 МЛН
SoftBank World 2023 孫 正義 特別講演 AGIを中心とした新たな世界へ
1:22:37
ソフトバンク公式 ビジネスチャンネル
Рет қаралды 985 М.
Is ChatGPT outdated? The latest AI is too advanced! [Claude]
23:48
アーロン【上京したい大学生】
Рет қаралды 4,4 М.
実は凄いClaudeのPDF support機能について解説&検証してみた
19:56
にゃんたのAIチャンネル
Рет қаралды 10 М.
日常的に使ってる本当に良い生成AIツール10選!
15:50
KEITO【AI&WEB ch】
Рет қаралды 24 М.
仕事で使えそう?DifyでRAGを行う時の設定について解説してみた
26:57
にゃんたのAIチャンネル
Рет қаралды 35 М.
Accompanying my daughter to practice dance is so annoying #funny #cute#comedy
00:17
Funny daughter's daily life
Рет қаралды 12 МЛН