PDF 問答
沒時間閱讀報告的救星。
為什麼這重要?因為它能在你最忙的時候,快速提升效率。
情境:
- 閱讀財報、ESG 報告、英文論文。
方案比較:
- ChatGPT-o3-mini-high:目前市面上最好的工具。
- ChatGPT-4o:所有人都可以用的免費版本
- ChatPDF:付費服務,中國軟體,品質比 ChatGPT-o1 略差。
- Google Gemini 2.0 Flash:不建議使用,嚴重幻覺,自行腦補資訊。
使用方式:
- 選擇推理模型(ChatGPT o3-mini-high、ChatGPT o1)
- 把 PDF 丟進去
- 問問題
限制:
- 可以 10 個以內的 PDF 檔案。
可以:
- 表格
- 藉由文字標籤看懂一點點的圖表
可以,但比較差:
- 儲存圖片的 PDF (文字無法選取)
- 多欄排版文字
不行:
- 圖表(只能依賴文字看懂一點點)。
- 圖片。
假如你直接把檔案截圖給 ChatGPT,他可以使用視覺工具看得懂,但 PDF 工具今天只限於文字,沒有圖片。
李慕約的指令:
總結這一份 PDF
- 總結功能:95 分
列出所有跟「XXX」有關的資訊
- 例如:列出「台積寶寶茁壯計畫」詳細細節
- 關鍵字追問:90 分,用關鍵字比對,列出的通常都是正確,但可能有遺漏的
列出所有跟「XXX 概念」有關的資訊
- 比方列出「女性權益有關」,ChatGPT 給我「台積寶寶茁壯計畫」這一種不是靠關鍵字比對,是過去會非常難找到的資訊。
- 概念追問:90 分,列出的通常都是正確,但可能有遺漏的
台積寶寶茁壯計畫,生一個小孩補助多少錢
- 問答表現得非常優秀,ChatGPT o3-mini-high 沒有出現幻覺。但 Gemini 2.0 會有幻覺(幻覺:明明沒有資料,但很有自信的回答錯誤的答案)
- 特定問題:100 分,在我們的實測中,ChatGPT 不知道就會回答不知道。
「XXX」的前後文是什麼?
- 查詢原始前後文:100 分,可以精確地提供關鍵字出現的前後文
這裡面哪裡有出現雙關語?
- 雙關語:100 分,推理模型真的非常優秀,居然可以抓到裡面雙關語!以我這邊的案例,我問他文件出現了什麼雙關語。他回答「與石俱進」。
ChatGPT - 雙關語分析
Shared via ChatGPT

「XXX」出現在第幾頁?
- 頁數查詢:0 分,這是目前 AI 還沒有辦法做到的地方。
其他測試:
以 BCG 精品錶的報告為例:

❌ PDF 裡面的文字標籤可以,但圖片不行。

❌ 「每個角色是什麼顏色?」「(ChatGPT) 我不知道」「(Gemini 答對一半)」