
ปัญญาประดิษฐ์ (Artificial Intelligence – AI) ได้เปลี่ยนจากแนวคิดเชิงทฤษฎี ไปสู่เครื่องมืออันทรงพลังที่ใช้ในหลากหลายอุตสาหกรรม ตั้งแต่การตลาดและการศึกษา ไปจนถึงการออกแบบ การพัฒนา และการสร้างสรรค์คอนเทนต์ในแบบต่างๆ ปัจจุบัน AI สามารถทำได้มากกว่าแค่ตอบคำถาม แต่ยังสามารถสร้างเนื้อหา ตีความข้อมูล หรือแม้กระทั่งสร้างไฟล์ในรูปแบบต่างๆตามความต้องการของผู้ใช้ ในบทความนี้ผมได้สรุปประเภทหลักๆของ AI โดยอาจจะเน้นไปที่ Generative AI ค่อนข้างมากสักหน่อย เพื่อที่ผู้อ่านได้เข้าใจและสำหรับท่านใด ที่ยังมองไม่ออกว่า AI แบบไหนเหมาะกับธุรกิจของคุณมากที่สุดครับ

5 ประเภทหลักๆของ AI ที่พบเห็นบ่อยมากที่สุด
1. ปัญญาประดิษฐ์แบบใช้กฎ (Rule-Based AI หรือ Symbolic AI)
ปัญญาประดิษฐ์แบบใช้กฎทำงานโดยอาศัยกฎเกณฑ์ หรือตรรกะที่ถูกตั้งโปรแกรมไว้ล่วงหน้า เพื่อทำการตัดสินใจหรือตอบสนองต่อข้อมูลที่ป้อนเข้าไป ระบบประเภทนี้มีความสามารถในการคาดการณ์ผลลัพธ์ได้ แต่ไม่มีความสามารถในการปรับตัวหรือเรียนรู้จากข้อมูลใหม่ อยากให้ลองนึกภาพเหมือนกับการเล่นเกมที่มีกฎเกณฑ์ตายตัว เช่น หมากรุก ในระบบ Rule-Based AI โปรแกรมเมอร์จะกำหนดกฎทุกอย่างที่ AI สามารถทำได้ และ AI จะปฏิบัติตามกฎเหล่านั้นอย่างเคร่งครัดเมื่อได้รับข้อมูลเข้ามา หากสถานการณ์ไม่อยู่ในกฎที่กำหนดไว้ AI จะไม่สามารถจัดการกับสถานการณ์นั้นได้
คำว่า “Symbolic AI” มาจากวิธีการที่ AI เหล่านี้ประมวลผลข้อมูล โดยใช้สัญลักษณ์ (Symbols) แทนความรู้และข้อเท็จจริงต่างๆ จากนั้นจึงใช้กฎทางตรรกะเพื่อจัดการกับสัญลักษณ์เหล่านี้ และให้เหตุผลเพื่อหาข้อสรุป ตัวอย่างของ Rule-Based AI หรือ Symbolic AI เช่น
- MYCIN (ระบบวินิจฉัยการติดเชื้อในกระแสเลือด) เป็นหนึ่งในระบบผู้เชี่ยวชาญแรกๆ ที่พยายามเลียนแบบความสามารถของแพทย์ผู้เชี่ยวชาญ ในการวินิจฉัยและให้คำแนะนำการรักษา สำหรับการติดเชื้อในกระแสเลือด MYCIN ใช้ฐานความรู้ที่เป็นชุดของกฎ “ถ้า-แล้ว” (If-then Rules) เพื่อให้เหตุผลและให้คำแนะนำ ที่อิงตามความรู้ทางการแพทย์ หากผู้ใช้ป้อนอาการและผลการตรวจ ระบบจะใช้กฎเหล่านี้เพื่อระบุความเป็นไปได้ของโรค
- AIML Chatbots (แชทบอทที่ใช้รูปแบบการสนทนาที่กำหนดไว้)
AIML เป็นภาษาที่ใช้สร้าง Chatbot อย่าง Eliza ซึ่งเป็นแชทบอทตัวแรกๆที่สามารถโต้ตอบกับผู้ใช้ได้ โดยอาศัยการจับคู่รูปแบบคำถามกับคำตอบที่ถูกกำหนดไว้ล่วงหน้า แชทบอทเหล่านี้ไม่ได้มีความเข้าใจในภาษาธรรมชาติอย่างแท้จริง แต่ตอบสนองตามรูปแบบที่ถูกโปรแกรมไว้เท่านั้น

Image Source: https://community.neontools.io/chatbots/
โดยสรุป Rule-Based AI หรือ Symbolic AI เป็นเหมือน “หุ่นยนต์ตามคำสั่ง” ที่ทำงานได้ดี ในงานที่มีกฎเกณฑ์ชัดเจนและคาดการณ์ได้ แต่มีข้อจำกัดในการจัดการกับสถานการณ์ใหม่ๆ หรือข้อมูลที่ไม่ตรงกับกฎที่ตั้งไว้
2. ระบบที่เรียนรู้ได้ด้วยตัวเอง (Machine Learning – ML)
การเรียนรู้ของเครื่องเป็นแขนงหนึ่งของปัญญาประดิษฐ์ ที่มุ่งเน้นการพัฒนาระบบที่สามารถเรียนรู้จากชุดข้อมูลขนาดใหญ่ และปรับปรุงความสามารถในการคาดการณ์ หรือตัดสินใจได้ด้วยตนเองเมื่อเวลาผ่านไป โดยไม่ต้องมีการตั้งโปรแกรมคำสั่งอย่างชัดเจนสำหรับทุกสถานการณ์ แทนที่จะป้อนกฎเกณฑ์ที่ตายตัวเหมือนใน Rule-Based AI แต่ ML ให้เสมือนกับป้อนอาหารให้กับระบบด้วยข้อมูลจำนวนมาก และปล่อยให้ระบบค้นหารูปแบบ และความสัมพันธ์ที่ซ่อนอยู่ในข้อมูลเหล่านั้นเอง เหมือนกับการสอนเด็กโดยการให้ตัวอย่างมากมาย แทนที่จะบอกกฎทุกอย่าง ระบบ ML จะค่อยๆปรับปรุงโมเดลของตัวเองเมื่อได้รับข้อมูลใหม่ ทำให้สามารถทำงานที่ซับซ้อนและปรับตัวได้ดีกว่า Rule-Based AI ML ซึ่งถือเป็นรากฐานสำคัญของ AI Application / Platform จำนวนมากในปัจจุบัน โดยแบ่งย่อยออกได้อีก 3 ประเภท ดังนี้
- การเรียนรู้แบบมีผู้สอน (Supervised Learning)
ในการเรียนรู้ประเภทนี้ ระบบจะได้รับการฝึกฝนด้วยชุดข้อมูลที่มีป้ายกำกับ (Labeled Data) ซึ่งหมายความว่า สำหรับข้อมูลนำเข้าแต่ละรายการ จะมีคำตอบหรือผลลัพธ์ที่ถูกต้องกำกับไว้ ตัวอย่างเช่น ในการฝึกระบบจำแนกภาพแมวและสุนัข รูปภาพแต่ละรูปจะถูกกำกับว่าเป็น “แมว” หรือ “สุนัข” ระบบจะเรียนรู้ความสัมพันธ์ ระหว่างคุณสมบัติของภาพกับป้ายกำกับเหล่านี้ เพื่อให้สามารถจำแนกภาพใหม่ที่ไม่เคยเห็นมาก่อนได้ - การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning)
ในการเรียนรู้ประเภทนี้ ระบบจะได้รับการฝึกฝนด้วยชุดข้อมูลที่ไม่มีป้ายกำกับ (Unlabeled Data) โดยมีเป้าหมายคือ ให้ระบบค้นหาโครงสร้าง รูปแบบ หรือความสัมพันธ์ที่ซ่อนอยู่ในข้อมูลด้วยตัวเอง ตัวอย่างเช่น การจัดกลุ่มลูกค้าที่มีพฤติกรรมการซื้อที่คล้ายคลึงกัน หรือการค้นหาความผิดปกติในข้อมูล - การเรียนรู้แบบเสริมกำลัง (Reinforcement Learning)
ในการเรียนรู้ประเภทนี้ ระบบจะเรียนรู้โดยการลองผิดลองถูกในสภาพแวดล้อมหนึ่ง ระบบจะได้รับรางวัล (Reward) เมื่อทำการตัดสินใจที่ถูกต้อง และถูกลงโทษ (Penalty) เมื่อทำการตัดสินใจที่ผิดพลาด โดยมีเป้าหมายคือ การเรียนรู้นโยบาย (Policy) ที่จะทำให้ได้รับรางวัลสะสมสูงสุด ตัวอย่างเช่น การฝึกหุ่นยนต์ให้เดิน หรือการพัฒนาระบบเล่นเกม
ตัวอย่างของ Machine Learning ที่เราคุ้นเคย เช่น
- Google Translate กับการเรียนรู้รูปแบบภาษา
Google Translate ใช้กระบวนการ Machine Learning เพื่อเรียนรู้ความสัมพันธ์ระหว่างภาษาต่างๆ จากชุดข้อมูลการแปลขนาดใหญ่ ทำให้สามารถแปลข้อความจากภาษาหนึ่ง ไปยังอีกภาษาหนึ่งได้อย่างเป็นธรรมชาติมากขึ้น โดยไม่ได้อาศัยกฎการแปลที่ตายตัวเท่านั้น - Netflix Recommendations กับการแนะนำตามพฤติกรรมการรับชม
ระบบแนะนำภาพยนตร์และรายการทีวีของ Netflix ใช้ Machine Learning เพื่อวิเคราะห์พฤติกรรมการรับชมของผู้ใช้แต่ละคน รวมถึงข้อมูลของผู้ใช้ที่มีความชอบคล้ายกัน เพื่อคาดการณ์ว่าผู้ใช้น่าจะสนใจเนื้อหาใดต่อไป - Scikit-learn เครื่องมือ ML บน Python
Scikit-learn ถือเป็นห้องสมุด Python ที่ได้รับความนิยมอย่างมาก ซึ่งมีเครื่องมือและอัลกอริธึมที่หลากหลาย สำหรับการใช้งาน Machine Learning เช่น การจำแนก การถดถอย การจัดกลุ่ม และการลดมิติของข้อมูล ทำให้ผู้พัฒนาสามารถสร้างและทดลองโมเดล ML ต่างๆได้ง่ายขึ้น


Image Source: https://scikit-learn.org/
โดยสรุปแล้ว Machine Learning เป็นแนวทางที่สำคัญในการสร้างระบบ AI ที่มีความยืดหยุ่น สามารถเรียนรู้และปรับปรุงได้เมื่อมีข้อมูลมากขึ้น ทำให้สามารถนำไปประยุกต์ใช้ในงานที่ซับซ้อน และมีการเปลี่ยนแปลงอยู่เสมอ ซึ่งแตกต่างจาก Rule-Based AI ที่มีความแข็งกระด้างและไม่สามารถเรียนรู้ได้ด้วยตนเอง
3. ปัญญาประดิษฐ์เชิงสร้างสรรค์ (Generative AI – GenAI)
ปัญญาประดิษฐ์เชิงสร้างสรรค์เป็นประเภทของ AI ที่มีความสามารถในการสร้างเนื้อหาใหม่ๆ โดยอิงจากรูปแบบข้อมูลที่ได้เรียนรู้มา GenAI สามารถสร้างสรรค์ผลลัพธ์ได้หลากหลายรูปแบบ ไม่ว่าจะเป็นข้อความ รูปภาพ วิดีโอ ดนตรี และอื่นๆ ที่เปรียบเสมือนศิลปินบนโลกดิจิทัลที่ได้รับการฝึกฝน บนคลังข้อมูลขนาดใหญ่ของผลงานเดิมที่มีอยู่แล้ว (เช่น ข้อความจากหนังสือ เว็บไซต์ รูปภาพนับล้าน วิดีโอหลากหลายประเภท เพลงจากแนวเพลงต่างๆ) จากนั้น AI จะเรียนรู้ลักษณะเฉพาะ รูปแบบ และสไตล์ของข้อมูลเหล่านั้น แล้วสามารถนำมาสร้างสรรค์สิ่งใหม่ๆที่ไม่เคยมีมาก่อนได้ ความน่าทึ่งของ GenAI ก็คือ ความสามารถในการสร้างสรรค์ผลงาน ที่มีความซับซ้อนและมีความหลากหลายสูง โดยแบ่งออกมาได้อีก 6 กลุ่ม/รูปแบบ คือ
- การสร้างข้อความ (Text Generation)
- ChatGPT (OpenAI)
ChatGPT ถือเป็นเป็นโมเดลภาษาขนาดใหญ่ ที่สามารถสร้างข้อความได้หลากหลายรูปแบบ ตั้งแต่การเขียนอีเมล์ บทความ บทภาพยนต์ การเขียนโพสต์ สรุปเนื้อหา ไปจนถึงการให้คำแนะนำในการเขียนโค้ด และอื่นๆ - Claude (Anthropic)
Claude เป็นอีกหนึ่งโมเดลภาษาขนาดใหญ่ ที่เน้นความสามารถในการสร้างสรรค์เนื้อหา ในรูปแบบยาวที่มีความซับซ้อน และได้รับการออกแบบมาให้มีการสนทนา ที่เป็นประโยชน์และคำนึงถึงประเด็นทางจริยธรรม
โดยมีรูปแบบผลลัพธ์ทั่วไปของ Text Generation อย่างเช่น .txt (ข้อความธรรมดา), .docx (เอกสาร Microsoft Word), .pdf (เอกสาร Portable Document Format), .md (Markdown), .html (HyperText Markup Language)
ตัวอย่าง AI รูปแบบ Text Generation ที่โดดเด่น เช่น ChatGPT, Jasper AI. Copy.ai, Zanroo AI, Botnoi AI

Image Source: chatgpt.com
- การสร้างภาพจากข้อความ (Text-to-Image)
- เทคโนโลยีนี้เป็นเหมือน “จิตรกร AI” ที่สามารถสร้างภาพใหม่ได้ เพียงแค่คุณป้อนคำอธิบายเป็นข้อความ (Prompt) โดย AI เหล่านี้ได้รับการฝึกฝนบนชุดข้อมูลภาพ และคำอธิบายจำนวนมหาศาล ทำให้พวกมันเข้าใจความสัมพันธ์ระหว่างคำศัพท์ต่างๆกับลักษณะของภาพ เมื่อคุณป้อนข้อความ เช่น “แมวใส่หมวกกันน็อคปั่นจักรยานบนดวงจันทร์” AI ก็จะประมวลผลคำเหล่านั้นและสร้างภาพ ที่ไม่เคยมีอยู่จริงตามคำอธิบายของคุณ
- ความสามารถนี้เปิดโอกาสใหม่ๆในหลายด้าน เช่น การสร้างภาพประกอบที่ไม่ซ้ำใครสำหรับบทความหรือเรื่องราว การสร้างงาน Digital Art ที่ไม่จำเป็นต้องมีทักษะการวาดภาพขั้นสูง การสร้างแบบจำลองผลิตภัณฑ์อย่างรวดเร็ว โดยไม่ต้องเสียเวลาถ่ายภาพจริง หรือแม้แต่การสร้างภาพคอนเซ็ปต์สำหรับภาพยนตร์และวิดีโอเกม
โดยมีรูปแบบผลลัพธ์ทั่วไปของ Text Generation อย่างเช่น .jpg (JPEG), .png (Portable Network Graphics), .webp (Web Picture format), .svg (Scalable Vector Graphics)
ตัวอย่าง AI รูปแบบ Text Generation ที่โดดเด่น เช่น DALL·E, Midjourney, Stable Diffusion, MePrompt, Canva

Image Source: midjourney.com
- การแก้ไขภาพ/เติมเต็มภาพ (Image-to-Image / Inpainting)
- เทคโนโลยีนี้ต่อยอดจากความสามารถในการสร้างภาพ โดยอนุญาตให้ผู้ใช้สามารถอัปโหลดภาพที่มีอยู่แล้ว และใช้ข้อความสั่งให้ AI แก้ไข ปรับปรุง หรือเติมเต็มส่วนที่ขาดหายไปของภาพได้
- Image-to-Image
คุณสามารถอัปโหลดภาพถ่ายและใช้ข้อความสั่งให้ AI เปลี่ยนสไตล์ของภาพ (เช่น เปลี่ยนภาพถ่ายให้เป็นภาพวาดสีน้ำมัน) หรือปรับเปลี่ยนองค์ประกอบบางอย่างในภาพได้ - Inpainting
คุณสามารถเลือกพื้นที่ที่ต้องการแก้ไขในภาพ (เช่น ลบวัตถุที่ไม่ต้องการ หรือซ่อมแซมส่วนที่เสียหาย) แล้วใช้ข้อความสั่งให้ AI เติมเต็มพื้นที่นั้นอย่างสมจริง โดยอิงจากบริบทของภาพโดยรวม
- Image-to-Image
- ความน่าสนใจ คือ เครื่องมือเหล่านี้มีประโยชน์อย่างมาก สำหรับการปรับปรุงคุณภาพของภาพถ่าย การลบสิ่งรบกวนสายตา การสร้างภาพที่มีองค์ประกอบที่ต้องการ หรือแม้แต่การฟื้นฟูภาพถ่ายเก่าที่ชำรุด โดยมีรูปแบบผลลัพธ์ทั่วไปของ Image-to-Image อย่างเช่น .psd (Adobe Photoshop Document), .png (Portable Network Graphics), .jpg (JPEG)
ตัวอย่าง AI รูปแบบ Image-to-Image ที่โดดเด่น เช่น Adobe Firefly, Stable Diffusion, Runway ML

Image Source: https://www.adobe.com/th_en/products/firefly.html
- การสร้างวิดีโอ (Video Generation)
- เทคโนโลยีนี้เป็นเหมือน “ผู้กำกับ AI” ที่สามารถสร้างวิดีโอคลิปใหม่ได้จากข้อความสั่ง หรือจากภาพนิ่งและคำอธิบายเพิ่มเติม แม้ว่าเทคโนโลยีนี้จะยังอยู่ในช่วงเริ่มต้น และยังไม่สมบูรณ์เท่าการสร้างภาพ แต่ก็มีความก้าวหน้าอย่างรวดเร็ว โดยแบ่งเป็น 2 รูปแบบย่อย คือ
- Text-to-Video: คุณสามารถป้อนคำอธิบายเป็นข้อความ เช่น “หุ่นยนต์เดินเล่นในเมืองอนาคต” และ AI จะพยายามสร้างวิดีโอสั้นๆ ที่แสดงภาพตามคำอธิบายนั้น
- Image-to-Video: บางเครื่องมืออนุญาตให้อัปโหลดภาพนิ่งและใช้ข้อความสั่งเพื่อทำให้ภาพนั้นเคลื่อนไหว หรือเพิ่มองค์ประกอบเคลื่อนไหวเข้าไป
- ความน่าสนใจ คือ ศักยภาพของเทคโนโลยีนี้มีมากมาย ตั้งแต่การสร้างโฆษณาสั้นๆ วิดีโอสอนให้ความรู้ Animation หรือในอนาคตอาจทำออกมาเป็นภาพยนต์ได้แล้ว โดยไม่ต้องมีทีมงานถ่ายทำและตัดต่อวิดีโอแบบดั้งเดิม นอกจากนี้ยังสามารถช่วยในการสร้างภาพจำลอง หรือสถานการณ์เสมือนจริงได้อีกด้วย โดยมีรูปแบบผลลัพธ์ทั่วไปของ Video Generation อย่างเช่น .mp4 (MPEG-4 Part 14), .mov (QuickTime Movie), .webm (WebM), .gif (Graphics Interchange Format)
ตัวอย่าง AI รูปแบบ Video Generation ที่โดดเด่น เช่น Sora (OpenAI), Synthesia, Runway Gen-2, HeyGen, Veed.io, Animoto, FlexClip

Image Source: https://www.heygen.com/
- การสร้างเสียง/ดนตรีจากข้อความ (Text-to-Music / Sound)
- เทคโนโลยีนี้เป็นเหมือน “นักแต่งเพลง AI” ที่สามารถสร้างสรรค์ดนตรี หรือเอฟเฟกต์เสียงใหม่ๆ ได้จากคำอธิบายข้อความ โดยคุณสามารถป้อนคำสั่ง เช่น “เพลงบรรเลงเปียโนสไตล์คลาสสิกที่ให้ความรู้สึกสงบ” หรือ “เสียงฝีเท้าบนพื้นไม้” และ AI จะพยายามสร้างเสียงหรือดนตรีที่ตรงกับคำอธิบายนั้น
- ความน่าสนใจ คือ เทคโนโลยีนี้มีประโยชน์สำหรับผู้สร้างคอนเทนต์ ที่ต้องการเพลงประกอบหรือเอฟเฟกต์เสียงที่ไม่ซ้ำใครสำหรับวิดีโอ เกม หรือแอปพลิเคชัน โดยไม่ต้องมีความรู้ด้านดนตรีขั้นสูง นอกจากนี้ยังสามารถเป็นเครื่องมือ ที่เอาไว้ช่วยในการสร้างสรรค์สำหรับนักดนตรีอีกด้วย โดยมีรูปแบบผลลัพธ์ทั่วไปของ Text-to-Music / Sound อย่างเช่น .mp3 (MPEG-1 Audio Layer III), .wav (Waveform Audio File Format), .ogg (Ogg Vorbis), .midi (Musical Instrument Digital Interface)
ตัวอย่าง AI รูปแบบ Text-to-Music / Sound ที่โดดเด่น เช่น Suno.ai, Google MusicLM, Soundraw, Aiva

Image Source: https://suno.com
- การสร้างโค้ด (Code Generation)
- เทคโนโลยีนี้เป็นเหมือน “AI Programmer” ที่สามารถสร้างโค้ดโปรแกรมในภาษาต่างๆ โดยคุณสามารถบอก AI ว่าต้องการให้โปรแกรมทำอะไร เช่น “สร้างฟังก์ชัน Python ที่เรียงลำดับตัวเลขในรายการ” และ AI จะพยายามสร้างโค้ดที่สามารถทำงานตามความต้องการนั้นได้
- ความน่าสนใจ คือ เครื่องมือเหล่านี้สามารถช่วยเพิ่มประสิทธิภาพในการพัฒนาซอฟต์แวร์ ลดเวลาในการเขียนโค้ดซ้ำๆ ช่วยผู้ที่ไม่มีพื้นฐานด้านการเขียนโปรแกรม ให้สามารถสร้างเครื่องมือหรือแอปพลิเคชันง่ายๆได้ และเป็นเครื่องมือที่มีประโยชน์สำหรับนักพัฒนา ในการสร้างต้นแบบอย่างรวดเร็ว หรือค้นหาวิธีการเขียนโค้ดในบางสถานการณ์ โดยมีรูปแบบผลลัพธ์ทั่วไปของ Code Generation อย่างเช่น .py (Python), .js (JavaScript), .html (HyperText Markup Language), .css (Cascading Style Sheets), .json (JavaScript Object Notation), .ipynb (Jupyter Notebook)
ตัวอย่าง AI รูปแบบ Code Generation ที่โดดเด่น เช่น GitHub Copilot, Replit AI, ChatGPT with Code Interpreter

Image Source: https://github.com/features/copilot
4. ปัญญาประดิษฐ์เชิงสนทนา (Conversational AI)
ปัญญาประดิษฐ์เชิงสนทนา คือ ระบบ AI ที่ได้รับการออกแบบมาเพื่อจำลองการสนทนากับมนุษย์ โดยใช้การประมวลผลภาษาธรรมชาติ (Natural Language Processing – NLP) ระบบเหล่านี้มีความสามารถในการเข้าใจ และตอบสนองต่อภาษาที่เราใช้ในชีวิตประจำวัน ไม่ว่าจะเป็นข้อความหรือเสียงพูด ลองนึกภาพว่าคุณกำลังคุยกับเพื่อนหรือผู้ช่วยที่เป็นมนุษย์ Conversational AI พยายามที่จะเลียนแบบประสบการณ์นั้น โดยการทำความเข้าใจสิ่งที่คุณพูดหรือพิมพ์เข้าไป ตีความความหมาย จับบริบทของการสนทนา สร้างคำตอบที่เหมาะสมและเป็นธรรมชาติออกมา ระบบเหล่านี้มักจะใช้เทคนิค Machine Learning (ML) โดยเฉพาะอย่างยิ่ง Deep Learning เพื่อเรียนรู้รูปแบบของภาษา และความหมายจากข้อมูลการสนทนาจำนวนมาก ทำให้พวกเขาสามารถจัดการกับคำถามและหัวข้อที่หลากหลายได้ ตัวอย่างเช่น
- ChatGPT, Google Gemini
โมเดลภาษาขนาดใหญ่นี้เป็นหนึ่งตัวอย่างที่โดดเด่นของ Conversational AI ที่สามารถเข้าใจและสร้างข้อความที่ซับซ้อน ตอบคำถาม ให้ข้อมูล สรุปเนื้อหา ช่วยเขียนบทความ หรือแม้กระทั่งสร้างโค้ดได้ - Alexa (Amazon), Siri (Apple)
ผู้ช่วยเสมือนเป็น Conversational AI ที่ถูกออกแบบมาเพื่อตอบสนองต่อคำสั่งเสียง ให้ข้อมูล ตั้งเวลาปลุก เล่นเพลง ควบคุมอุปกรณ์สมาร์ทโฮม และอื่นๆ โดยมีความสามารถในการเข้าใจภาษาพูด และตอบกลับด้วยเสียง - Chatbot
บริษัทต่างๆมักจะใช้ Conversational AI ในรูปแบบของแชทบอท บนเว็บไซต์หรือแอปพลิเคชัน เพื่อตอบคำถามลูกค้า ให้ความช่วยเหลือเบื้องต้น หรือนำทางไปยังข้อมูลที่ต้องการ
โดยมีรูปแบบผลลัพธ์ทั่วไปของ Conversational AI อย่างเช่น
- การตอบกลับเป็นข้อความหรือบทสรุป (.txt, .docx) ซึ่งเป็นรูปแบบการตอบกลับที่พบได้บ่อยที่สุด
- การถอดเสียง (.srt, .vtt, .pdf) สำหรับกรณีของการประมวลผลเสียงพูด ระบบสามารถถอดเสียงออกมาเป็นข้อความในรูปแบบไฟล์ต่างๆ
- บันทึกการดำเนินการหรือการตอบกลับด้วยเสียง (.mp3, .wav) สำหรับผู้ช่วยเสมือนที่โต้ตอบด้วยเสียง พวกเขาจะให้ผลลัพธ์เป็นไฟล์เสียง หรือบันทึกการดำเนินการที่พวกเขาได้ทำ

Image Source: https://www.apple.com/th/siri/
5. หน่วยปฏิบัติการอัตโนมัติ (Autonomous Agents หรือ Agentic AI)
หน่วยปฏิบัติการอัตโนมัติ คือ ระบบ AI ที่สามารถดำเนินงานต่างๆได้ด้วยตนเอง โดยอิงตามเป้าหมาย บริบท และตรรกะที่ถูกกำหนดไว้ พวกมันมีความสามารถในการวางแผน ตัดสินใจ และดำเนินการ โดยแทบไม่ต้องมีการแทรกแซงจากมนุษย์โดยตรง เมื่อได้รับมอบหมายเป้าหมายแล้ว ลองจินตนาการถึงผู้ช่วยอัจฉริยะ (AI Assistant) ที่ไม่เพียงแต่ตอบคำถามหรือทำตามคำสั่งง่ายๆ แต่ยังสามารถรับมอบหมายเป้าหมายที่ซับซ้อนกว่านั้นได้ เช่น “ทำการวิเคราะห์แนวโน้มตลาดล่าสุดสำหรับรถยนต์ไฟฟ้า และนำเสนอรายงานสรุปพร้อมข้อเสนอแนะ” จากนั้น Autonomous Agent หรือ Agentic AI จะสามารถวางแผนขั้นตอนต่างๆที่จำเป็นในการบรรลุเป้าหมายนี้ ตั้งแต่การค้นหาข้อมูล การวิเคราะห์ข้อมูล ไปจนถึงการเขียนรายงาน โดยที่มนุษย์มีหน้าที่เพียงแค่กำหนดเป้าหมายในตอนแรก และตรวจสอบผลลัพธ์ในภายหลัง
ระบบ AI นี้มีความสามารถในการรับรู้สภาพแวดล้อม (Context) เข้าใจเป้าหมายที่ได้รับมอบหมาย วางแผนลำดับการทำงาน ตัดสินใจว่าจะดำเนินการอย่างไร และดำเนินการตามแผนนั้น และยังงสามารถเรียนรู้จากประสบการณ์ และปรับปรุงวิธีการทำงานของตัวเองได้เมื่อเวลาผ่านไปได้อีก ตัวอย่างเช่น
- AutoGPT, BabyAGI
โครงการ Open Source เหล่านี้เป็นตัวอย่างแรกๆของ Autonomous Agents ที่ได้รับความสนใจอย่างมาก พวกมันสามารถถูกตั้งค่าด้วยเป้าหมายกว้างๆ และจะพยายามบรรลุเป้าหมายนั้นโดยการสร้างและดำเนินการตาม “ความคิด” หรือขั้นตอนต่างๆด้วยตนเอง เช่น การค้นหาข้อมูลออนไลน์ การเขียนโค้ด หรือการโต้ตอบกับเครื่องมืออื่นๆ - Custom GPTs (บนแพลตฟอร์ม ChatGPT)
ผู้ใช้สามารถสร้าง GPTs ที่ปรับแต่งเองได้ โดยกำหนดวัตถุประสงค์ ความรู้ และชุดคำสั่งเฉพาะเจาะจง ทำให้ GPT เหล่านี้สามารถทำงานเฉพาะทางได้มากขึ้น เช่น การเป็นผู้ช่วยเขียนบทความในหัวข้อใดหัวข้อหนึ่ง หรือการวิเคราะห์ข้อมูลในรูปแบบเฉพาะ - Adept ACT-1
เป็นตัวอย่างของ Autonomous Agent ที่มีความสามารถ ในการโต้ตอบกับแอปพลิเคชันซอฟต์แวร์ต่างๆ โดยมีเป้าหมายที่จะทำให้การทำงานกับซอฟต์แวร์ เป็นไปโดยอัตโนมัติมากขึ้น
โดยมีรูปแบบผลลัพธ์ทั่วไปของ Autonomous Agents หรือ Agentic AI อย่างเช่น
- บันทึกการทำงาน (.txt) ที่ใช้บันทึกขั้นตอนการทำงาน การตัดสินใจ และผลลัพธ์ระหว่างการดำเนินงานของ Agent
- ขั้นตอนการทำงาน (.json, .csv) โดยอาจแสดงลำดับของงาน หรือข้อมูลที่ถูกประมวลผลในรูปแบบโครงสร้าง
- รายงาน (.docx, .pdf) เมื่อ Agent ทำงานวิเคราะห์หรือวิจัยเสร็จสิ้น ก็มักจะนำเสนอผลลัพธ์ในรูปแบบรายงานที่อ่านง่าย

Image Source: https://babyagi-ui.vercel.app/
Autonomous Agents หรือ Agentic AI เป็นวิวัฒนาการอีกขั้นของ AI ที่ก้าวข้ามการตอบสนองต่อคำสั่งโดยตรง ไปสู่การทำงานเชิงรุกและการแก้ปัญหาด้วยตนเอง ทำให้มีศักยภาพในการปฏิวัติวิธีการทำงานในหลายอุตสาหกรรม โดยการมอบหมายงานที่ซับซ้อนและต้องใช้การตัดสินใจให้กับ AI ในระดับที่สูงขึ้นนั่นเองครับ

ตารางสรุปนามสกุลไฟล์ที่สร้างโดย AI
หมวดหมู่ | ประเภทไฟล์ / รูปแบบ | นามสกุลไฟล์ (Extension) | วัตถุประสงค์ / การใช้งาน |
---|---|---|---|
ข้อความ | ข้อความธรรมดา | .txt, .md | บันทึกทั่วไป สคริปต์แชต บันทึกโน้ต |
เอกสาร | .docx, .odt | รายงาน เนื้อหาบทความ ร่างข้อเสนอ | |
ไฟล์ PDF | เอกสารที่เสร็จสมบูรณ์ รายงานอย่างเป็นทางการ | ||
Presentation Slide | .pptx, .key, .pdf | พรีเซนต์ธุรกิจ สไลด์สอนงานที่ให้ AI ช่วยจัดทำ | |
Table / Spreadsheet | .csv, .xlsx, .ods | วิเคราะห์ข้อมูล รายงานผลลัพธ์ หรือการแปลงข้อมูลจาก AI | |
เนื้อหาบนเว็บไซต์ | .html, .css, xml | เนื้อหาเว็บไซต์ บล็อก รูปแบบ UI | |
ข้อมูลแบบมีโครงสร้าง | .json, .yaml, .xml | ใช้งานร่วมกับ API, Chatbot และการตั้งค่าโมเดล AI | |
รูปภาพ | Raster Image | .jpg, .jpeg, .png, .bmp, .webp, .tiff | ภาพจาก AI สำหรับงานออกแบบ คอนเทนต์ โฆษณา หรือโพสต์โซเชียล |
Vector Image | .svg, .ai, .eps, .pdf | โลโก้ ภาพประกอบ อินโฟกราฟิกแบบปรับขนาดได้ | |
ไฟล์ Photoshop | .psd | งานดีไซน์แบบเลเยอร์ แก้ไขภาพต่อในโปรแกรม Photoshop | |
ภาพประสิทธิภาพสูง | .heic, .heif | ภาพจาก iPhone หรือแอปมือถือที่ใช้ AI | |
เสียง | ไฟล์เสียงทั่วไป | .mp3, .wav, .aac, .flac, .ogg, .m4a | ดนตรีที่สร้างโดย AI เสียงพากย์ เสียงพูดจาก TTS หรือ Podcast |
ไฟล์ MIDI | .mid, .midi | การสร้างเพลง เครื่องดนตรีเสมือนด้วย AI | |
เสียงพูด (TTS) พร้อม Metadata | .json (พร้อมข้อมูลเสียง) | ผลลัพธ์จากระบบอ่านออกเสียง เช่น ElevenLabs, Azure Speech | |
วิดีโอ | ไฟล์วิดีโอมาตรฐาน | .mp4, .mov, .avi, .mkv, .webm | วิดีโอที่สร้างจาก AI เช่น คลิปสั้น สื่อการเรียน |
Animation / GIF | .gif, .apng | Animation และภาพเคลื่อนไหวจาก AI | |
ไฟล์โปรเจกต์วิดีโอ | .prproj, .aep, .drp | Project Editor จาก Premiere Pro, After Effects หรือ DaVinci Resolve | |
3D / XR / การออกแบบ | โมเดล 3 มิติ | .obj, .fbx, .glb, .gltf, .stl | โมเดลจาก AI สำหรับ AR/VR เกม หรือสถาปัตยกรรม |
ฉากและเลย์เอาท์ | .usd, .usdz, .blend | ใช้ใน AR (Apple) การแชร์ฉาก 3D การออกแบบใน Blender | |
งาน CAD / วิศวกรรม | .step, iges | การออกแบบทางอุตสาหกรรมโดยใช้ AI | |
การเขียนโค้ด / การพัฒนาโปรแกรม | Source Code | .py, .js, .ts, .cpp, .java, .html | โค้ดจาก AI สำหรับ Software Projects การเขียนสคริปต์ หรือระบบอัตโนมัติ |
Notebooks | .jpynb | ไฟล์สำหรับการวิเคราะห์ข้อมูลด้วย Python และ ML | |
Script Automation | .sh, .bat, .ps1 | สคริปต์สำหรับการทำงานอัตโนมัติ Deployment หรือ DevOps | |
การวิเคราะห์ | แผนภูมิ / กราฟ | .png, .svg, .pdf, .pptx | แผนภูมิจาก AI เช่นการวิเคราะห์จาก ChatGPT + Advanced Data Analytics |
ข้อมูลการวิเคราะห์ | .csv, .json, .xlsx | การประมวลผลแบบเชิงลึก การพยากรณ์ การทำเซ็กเมนต์ลูกค้า | |
Specialized AI | AI Model Weights | .bin, .pt, .ckpt, safetensors | ไฟล์สำหรับ Trained Weights Model เช่น GPT, LLaMA, Stable Diffusion |
ไฟล์ ONNX | .onnx | ใช้สำหรับโมเดล AI แบบข้ามแพลตฟอร์ม | |
Prompt / Workflow Data | .json, .yaml, .pkl | ระบบ workflow เช่น LangChain, Flowise และการตั้งค่าระบบ AI อื่นๆ |
ในตอนนี้เราจะเห็นว่า Generative AI บางแพลตฟอร์ม ก็สามารถทำได้หลากหลายอย่างพร้อมกัน และมีหลากหลายประเภทของ AI ซ่อนอยู่เบื้องหลังการทำงาน อย่างเช่น FlexClip และแฟลตฟอร์มอื่นๆในตลาด ซึ่งเป็นแพลตฟอร์มตัดต่อวีดิโอออนไลน์ (Online Video Editor Platform) ที่มีขีดความสามารถหลากหลายอย่าง เช่น
- การสร้างวิดีโอจากข้อความ (AI Text-to-Video)
- การแปลงบทความบล็อกเป็นวิดีโอ (Blog-to-Video)
- การสร้างวิดีโอจากบท (Script-to-Video)
- โปรแกรมแปลภาษา (AI Translator)
- การสร้างคำบรรยายใต้ภาพอัตโนมัติ (Auto Subtitles)
- การแปลงข้อความเป็นเสียงพูด (AI Text-to-Speech)
- โปรแกรมสร้างภาพ (AI Image Generator)
- การสลับใบหน้า (AI Face-swap)
- การขยายภาพด้วย (AI Image-extender)
- การเพิ่มความละเอียดภาพ (AI Image-upscaler)
- การใส่สีให้ภาพถ่ายขาวดำ (AI Photo Colorizer)
- การบูรณะภาพถ่ายเก่าด้วย (AI Old Photo Restoration)
- Royalty-Free Stock นับล้านรายการ รวมถึงภาพถ่าย วิดีโอ และเพลง
- การปรับแต่งวีดิโอได้หลากหลายแบบ เช่น Speed Curve, Freeze Frame, Split Screen Video, Reverse Video และ Chroma Key
- รวมถึง Template ต่างๆ
หากสนใจเรียนรู้ลองเข้าไปดูตัวอย่างได้ที่นี่ครับ >>> https://www.flexclip.com/

Image Source: https://www.flexclip.com/
ปัจจุบันต้องยอมรับเลยครับว่า AI ไม่ได้เป็นเพียงแค่การเลียนแบบสติปัญญาอีกต่อไป แต่เป็นการยกระดับความคิดสร้างสรรค์ ผลผลิต และประสิทธิภาพ ด้วยความสามารถในการสร้างผลลัพธ์ ในรูปแบบที่หลากหลาย AI จึงกลายเป็นเครื่องมืออเนกประสงค์สำหรับนักเขียน นักออกแบบ นักพัฒนา นักการตลาด นักดนตรี และอีกมากมาย ที่จำเป็นต้องเรียนรู้ไปตลอดนั่นเอง