Skip to main content

研究

PDF 問答

沒時間閱讀報告的救星。

為什麼這重要?因為它能在你最忙的時候,快速提升效率。

情境:

  • 閱讀財報、ESG 報告、英文論文。

方案比較:

  • ChatGPT-o3-mini-high:目前市面上最好的工具。
  • ChatGPT-4o:所有人都可以用的免費版本
  • ChatPDF:付費服務,中國軟體,品質比 ChatGPT-o1 略差。
  • Google Gemini 2.0 Flash:不建議使用,嚴重幻覺,自行腦補資訊。

使用方式:

  • 選擇推理模型(ChatGPT o3-mini-high、ChatGPT o1)
  • 把 PDF 丟進去
  • 問問題

限制:

  • 可以 10 個以內的 PDF 檔案。

可以:

  • 表格
  • 藉由文字標籤看懂一點點的圖表

可以,但比較差:

  • 儲存圖片的 PDF (文字無法選取)
  • 多欄排版文字

不行:

  • 圖表(只能依賴文字看懂一點點)。
  • 圖片。

假如你直接把檔案截圖給 ChatGPT,他可以使用視覺工具看得懂,但 PDF 工具今天只限於文字,沒有圖片。

李慕約的指令:

總結這一份 PDF
  • 總結功能:95 分

列出所有跟「XXX」有關的資訊
  • 例如:列出「台積寶寶茁壯計畫」詳細細節
  • 關鍵字追問:90 分,用關鍵字比對,列出的通常都是正確,但可能有遺漏的

列出所有跟「XXX 概念」有關的資訊
  • 比方列出「女性權益有關」,ChatGPT 給我「台積寶寶茁壯計畫」這一種不是靠關鍵字比對,是過去會非常難找到的資訊。
  • 概念追問:90 分,列出的通常都是正確,但可能有遺漏的

台積寶寶茁壯計畫,生一個小孩補助多少錢
  • 問答表現得非常優秀,ChatGPT o3-mini-high 沒有出現幻覺。但 Gemini 2.0 會有幻覺(幻覺:明明沒有資料,但很有自信的回答錯誤的答案)
  • 特定問題:100 分,在我們的實測中,ChatGPT 不知道就會回答不知道。

「XXX」的前後文是什麼?
  • 查詢原始前後文:100 分,可以精確地提供關鍵字出現的前後文

這裡面哪裡有出現雙關語?
  • 雙關語:100 分,推理模型真的非常優秀,居然可以抓到裡面雙關語!以我這邊的案例,我問他文件出現了什麼雙關語。他回答「與石俱進」。
ChatGPT - 雙關語分析
Shared via ChatGPT

「XXX」出現在第幾頁?
  • 頁數查詢:0 分,這是目前 AI 還沒有辦法做到的地方。

其他測試:

以 BCG 精品錶的報告為例:

https://web-assets.bcg.com/d9/2c/54d07ddd411aae9a095519930101/bcg-luxury-preowned-watches-your-time-has-come-mar-2023.pdf

❌ PDF 裡面的文字標籤可以,但圖片不行。

❌ 「每個角色是什麼顏色?」「(ChatGPT) 我不知道」「(Gemini 答對一半)」