Memory & RAG

ทำไม ChatGPT จำข้อมูลคุณได้แค่ครึ่งเดียว? และนักวิจัยเพิ่งค้นพบวิธีทำให้ AI จำดีขึ้น 10 เท่า

2026-05-03 · ~2 นาที · Memory & RAG

คำนำ

เคยรู้สึกไหมว่า ChatGPT จำอะไรเราไม่ค่อยได้? บอกไปว่า "ชอบกินส้ม" แล้ววันต่อมามันแนะนำเมนูส้มให้ แต่อาทิตย์ต่อมามันลืมไปแล้ว? คุณไม่ได้คิดไปเองครับ — จากการทดสอบจริง ระบบความจำของ ChatGPT ตอบถูกแค่ 52.9% ใน benchmark มาตรฐาน นั่นหมายความว่าจำผิดหรือจำไม่ได้เกือบครึ่งหนึ่ง! แต่เดือนเมษายน 2026 ที่ผ่านมา มีงานวิจัยใหม่ชื่อ "MemMachine" ที่ทำให้ AI จำได้แม่นถึง 93% — ดีกว่า ChatGPT เกือบ 2 เท่า วันนี้เราจะมาเปิดความลับว่าทำไมความจำ AI ถึงยังไม่ดีพอ และนักวิจัยเพิ่งค้นพบวิธีแก้ที่น่าทึ่งมาก

เนื้อหา

ระบบความจำ ChatGPT ทำงานยังไง?

เมื่อต้นปี 2024 OpenAI เปิดตัวฟีเจอร์ "Memory" ให้ ChatGPT — ในทางทฤษฎี AI จะจำข้อมูลเกี่ยวกับคุณ เช่น ชื่อ อาชีพ ความชอบ ข้อจำกัดด้านสุขภาพ แล้วนำมาใช้ตอบคำถามได้ดีขึ้นในอนาคต

กลไกภายในคร่าวๆ:

  1. สกัดข้อมูล: เมื่อคุณคุยกับ ChatGPT มันจะวิเคราะห์ข้อความแล้ว "ตัดสินใจเอง" ว่าอะไรน่าจะจำ — เช่น คุณบอกว่า "ฉันแพ้ถั่ว" → มันสกัด fact ว่า "แพ้ถั่ว"
  1. เก็บ: เก็บเป็นประโยคภาษาธรรมดา (natural language) ในระบบของ OpenAI
  1. ดึงมาใช้: ตอนคุยครั้งต่อไป ระบบจะเอา memories ที่เกี่ยวข้องยัดเข้าไปในคำสั่งเบื้องต้น (system prompt) ของการสนทนา

ดูดีใช่ไหม? แต่ปัญหาคือ...

คะแนนจริง: ChatGPT Memory ได้แค่ 52.9%!

นักวิจัยจาก Mem0 (บริษัทที่ทำระบบความจำ AI แบบ open-source) ได้ทดสอบระบบความจำต่างๆ ด้วย benchmark ชื่อ LOCOMO ซึ่งเป็นแบบทดสอบมาตรฐานวัดความสามารถในการจำข้อมูลข้ามการสนทนา ผลออกมาน่าตกใจ:

ระบบความแม่นยำ
ChatGPT Memory (built-in)52.9%
Full Context (ยัดข้อมูลทั้งหมดเข้าไป)72.9%
Mem0 (ระบบความจำเฉพาะทาง)91.6%

สังเกตไหม? แค่ "ยัดข้อมูลทั้งหมด" เข้าไป (72.9%) ก็ดีกว่าใช้ระบบ Memory ของ ChatGPT (52.9%) แล้ว!

ทำไม ChatGPT Memory ถึงคะแนนต่ำ?

สกัดข้อมูลไม่ครบ: บางครั้มันตัดสินใจผิดว่าอะไรสำคัญ อะไรไม่สำคัญ ไม่มี semantic search: ค้นหาแบบพื้นฐาน ไม่เข้าใจ "ความหมาย" ของคำถาม แค่ยัดเข้า prompt: วิธีการ retrieve ง่ายเกินไป — ไม่ได้เลือกเฉพาะที่เกี่ยวข้องจริงๆ

MemMachine: วิธีคิดใหม่ที่ทำให้ AI จำได้ 93%

เดือนเมษายน 2026 ทีมนักวิจัยนำโดย Wang et al. ตีพิมพ์งานวิจัยชื่อ "MemMachine" ที่เสนอแนวคิดตรงข้ามกับที่ ChatGPT ใช้ — และได้ผลน่าทึ่ง

แนวคิดหลัก: "อย่าทิ้งของดิบ — เก็บไว้ทั้งหมดแล้วใช้วิธีค้นหาที่ฉลาด"

ลองนึกภาพสองวิธีจัดการห้องสมุด: วิธีที่ 1 (แบบ ChatGPT): อ่านหนังสือทุกเล่ม → เขียนสรุปแต่ละเล่มแบบสั้นๆ → ทิ้งหนังสือเดิม → ตอนต้องการข้อมูล ก็เปิดสรุปอ่าน ปัญหา: สรุปอาจตกหล่นข้อมูลสำคัญ แถมบางทีสรุปผิดด้วย วิธีที่ 2 (แบบ MemMachine): เก็บหนังสือทุกเล่มไว้ทั้งหมด → สร้างระบบค้นหาที่ฉลาดมาก → ตอนต้องการข้อมูล ค้นหาเจอแม่นๆ แล้วไปอ่านจากต้นฉบับโดยตรง ข้อดี: ไม่มีข้อมูลสูญหาย เพราะของจริงยังอยู่

สถาปัตยกรรม MemMachine — 3 ชั้นความจำ

MemMachine แบ่งความจำเป็น 3 ชั้น:

ชั้นหน้าที่เปรียบเทียบ
Short-term Memoryเก็บบทสนทนาปัจจุบันเหมือน "โน้ตบนมือ" — จำได้แค่ตอนนี้
Long-term Episodic Memoryเก็บบทสนทนาเก่าทั้งหมด (ไม่ทิ้ง!)เหมือน "ห้องสมุด" — ของเก่ายังอยู่ ตอนต้องการก็ไปหาเจอ
Profile Memoryเก็บข้อมูลถาวรเกี่ยวกับคุณเหมือน "บัตรประชาชน" — ข้อมูลพื้นฐานที่ไม่เปลี่ยน

จุดเด่น: Retrieval Agent ที่ปรับตัวได้

MemMachine มี "ตัวแทนค้นหา" (Retrieval Agent) ที่ฉลาดมาก — มันไม่ได้ค้นหาทุกคำถามด้วยวิธีเดียวกัน แต่ ปรับวิธีค้นหาตามความยากของคำถาม:

  1. คำถามง่าย → ค้นหาธรรมดา (Direct Retrieval)

เช่น "ฉันบอกว่าแพ้อะไร?" → ค้นหาคำว่า "แพ้" ได้เลย

  1. คำถามซับซ้อน → แตกเป็นหลายคำถามย่อย แล้วค้นหาพร้อมกัน (Parallel Decomposition)

เช่น "เมนูอาหารที่เหมาะกับฉันมีอะไรบ้าง?" → แตกเป็น "แพ้อะไร?" + "ชอบอะไร?" + "ไม่กินอะไร?" → ค้นหาพร้อมกัน

  1. คำถามที่ต้องตามลุย → ค้นหาเป็นลูกโซ่ (Iterative Chain-of-Query)

เช่น "โปรเจกต์ที่ฉันทำเมื่อเดือนก่อน ตอนนี้ความคืบหน้าเป็นยังไง?" → ค้นหา "โปรเจกต์เดือนก่อน" ก่อน → เจอชื่อโปรเจกต์ → ค้นหาต่อด้วยชื่อโปรเจกต์

ผลการทดสอบ: MemMachine ทำลายสถิติ

Benchmarkคะแนน MemMachineหมายเหตุ
LoCoMo91.69%เทียบ Mem0 91.6%, ChatGPT 52.9%
LongMemEvalS (ICLR 2025)93.0%Benchmark มาตรฐานจากงานประชุมชั้นนำ
HotpotQA-hard93.2%คำถามยากข้ามเอกสารหลายฉบับ

และที่น่าประทับใจที่สุด — MemMachine ใช้ token น้อยกว่า Mem0 ถึง 80% แปลว่า: ประหยัดต้นทุน 5 เท่า ตอบเร็วกว่า แถมแม่นกว่าอีก!

บทเรียนสำคัญ: 5 สิ่งที่เราเรียนรู้

1. "ระบบค้นหาที่ดี สำคัญกว่า ข้อมูลเยอะ"

ยัดข้อมูลทั้งหมดเข้า AI (72.9%) ดีกว่าใช้ระบบ Memory ที่ไม่ดี (52.9%) แต่ค้นหาเก่งๆ (93%) ดีกว่าทั้งสองอย่าง!

2. "อย่าทิ้งของดิบ"

การสรุปแล้วทิ้งต้นฉบับ = เสี่ยงสูญเสียข้อมูลสำคัญ เก็บ raw data ไว้ + ใช้ smart retrieval = ไม่สูญเสียอะไรเลย

3. "ปรับวิธีค้นหาตามคำถาม"

คำถามง่าย ไม่ต้องค้นหาซับซ้อน → เสียเวลาเปล่า คำถามยาก ต้องค้นหาแบบเฉพาะทาง → ถึงจะเจอคำตอบ

4. "เน้นปรับปรุงการค้นหา มากกว่าการปรับข้อมูลตอนเก็บ"

จาก ablation study: ปรับ retrieval depth (+4.2%) สำคัญกว่า ปรับ chunking ตอนเก็บ (+0.8%) ถึง 5 เท่า!

5. "โมเดลเล็ก + Prompt ดี > โมเดลใหญ่"

MemMachine ใช้ GPT-4.1-mini (โมเดลเล็ก) แต่ออกแบบ prompt ดี → ได้ผลดีกว่าใช้โมเดลใหญ่ บทเรียน: อย่าเพิ่งเปลืองเงินซื้อโมเดลแพง — ลองปรับ prompt ก่อน

สรุป

ระบบความจำ AI ยังไม่สมบูรณ์ — ChatGPT Memory จำได้แค่ครึ่งหนึ่งของที่เราบอกไป แต่งานวิจัยล่าสุดจาก MemMachine แสดงให้เห็นว่าปัญหาไม่ได้อยู่ที่ว่า AI "จำไม่ได้" แต่อยู่ที่ว่า AI "หาข้อมูลไม่เจอ" สูตรสำเร็จคือ "เก็บของดิบไว้ทั้งหมด + ค้นหาด้วยวิธีที่ฉลาด" แทนที่จะ "สรุปแล้วทิ้ง" แบบเดิมๆ — ผลคือ AI จำได้แม่นขึ้นจาก 53% เป็น 93% ใช้ทรัพยากรน้อยลง 80% แถมปรับตัวได้ตามความยากของคำถามอีกด้วย นี่คืออนาคตของ AI ที่ "จำเราได้จริง"

แหล่งอ้างอิง

OpenAI Memory Announcement: https://openai.com/index/memory/ Simon Willison Analysis: https://simonwillison.net/2024/Feb/14/chatgpt-memory/ Mem0 Research & Benchmarks: https://mem0.ai/research MemMachine (Wang et al., April 2026): https://arxiv.org/abs/2604.04853 LangMem Library: https://github.com/langchain-ai/langmem

📌 Source: https://arxiv.org/abs/2605.05274