A_wallpaper_of_artificial_intelligence_(AI)

ปัญญาประดิษฐ์ (Artificial Intelligence – AI) ได้เปลี่ยนจากแนวคิดเชิงทฤษฎี ไปสู่เครื่องมืออันทรงพลังที่ใช้ในหลากหลายอุตสาหกรรม ตั้งแต่การตลาดและการศึกษา ไปจนถึงการออกแบบ การพัฒนา และการสร้างสรรค์คอนเทนต์ในแบบต่างๆ ปัจจุบัน AI สามารถทำได้มากกว่าแค่ตอบคำถาม แต่ยังสามารถสร้างเนื้อหา ตีความข้อมูล หรือแม้กระทั่งสร้างไฟล์ในรูปแบบต่างๆตามความต้องการของผู้ใช้ ในบทความนี้ผมได้สรุปประเภทหลักๆของ AI โดยอาจจะเน้นไปที่ Generative AI Link ค่อนข้างมากสักหน่อย เพื่อที่ผู้อ่านได้เข้าใจและสำหรับท่านใด ที่ยังมองไม่ออกว่า AI แบบไหนเหมาะกับธุรกิจของคุณมากที่สุดครับ

5 ประเภทหลักๆของ AI ที่พบเห็นบ่อยมากที่สุด

1. ปัญญาประดิษฐ์แบบใช้กฎ (Rule-Based AI หรือ Symbolic AI)

ปัญญาประดิษฐ์แบบใช้กฎทำงานโดยอาศัยกฎเกณฑ์ หรือตรรกะที่ถูกตั้งโปรแกรมไว้ล่วงหน้า เพื่อทำการตัดสินใจหรือตอบสนองต่อข้อมูลที่ป้อนเข้าไป ระบบประเภทนี้มีความสามารถในการคาดการณ์ผลลัพธ์ได้ แต่ไม่มีความสามารถในการปรับตัวหรือเรียนรู้จากข้อมูลใหม่ อยากให้ลองนึกภาพเหมือนกับการเล่นเกมที่มีกฎเกณฑ์ตายตัว เช่น หมากรุก ในระบบ Rule-Based AI โปรแกรมเมอร์จะกำหนดกฎทุกอย่างที่ AI สามารถทำได้ และ AI จะปฏิบัติตามกฎเหล่านั้นอย่างเคร่งครัดเมื่อได้รับข้อมูลเข้ามา หากสถานการณ์ไม่อยู่ในกฎที่กำหนดไว้ AI จะไม่สามารถจัดการกับสถานการณ์นั้นได้

คำว่า “Symbolic AI” มาจากวิธีการที่ AI เหล่านี้ประมวลผลข้อมูล โดยใช้สัญลักษณ์ (Symbols) แทนความรู้และข้อเท็จจริงต่างๆ จากนั้นจึงใช้กฎทางตรรกะเพื่อจัดการกับสัญลักษณ์เหล่านี้ และให้เหตุผลเพื่อหาข้อสรุป ตัวอย่างของ Rule-Based AI หรือ Symbolic AI เช่น

  • MYCIN (ระบบวินิจฉัยการติดเชื้อในกระแสเลือด) เป็นหนึ่งในระบบผู้เชี่ยวชาญแรกๆ ที่พยายามเลียนแบบความสามารถของแพทย์ผู้เชี่ยวชาญ ในการวินิจฉัยและให้คำแนะนำการรักษา สำหรับการติดเชื้อในกระแสเลือด MYCIN ใช้ฐานความรู้ที่เป็นชุดของกฎ “ถ้า-แล้ว” (If-then Rules) เพื่อให้เหตุผลและให้คำแนะนำ ที่อิงตามความรู้ทางการแพทย์ หากผู้ใช้ป้อนอาการและผลการตรวจ ระบบจะใช้กฎเหล่านี้เพื่อระบุความเป็นไปได้ของโรค
  • AIML Chatbots (แชทบอทที่ใช้รูปแบบการสนทนาที่กำหนดไว้)
    AIML เป็นภาษาที่ใช้สร้าง Chatbot อย่าง Eliza ซึ่งเป็นแชทบอทตัวแรกๆที่สามารถโต้ตอบกับผู้ใช้ได้ โดยอาศัยการจับคู่รูปแบบคำถามกับคำตอบที่ถูกกำหนดไว้ล่วงหน้า แชทบอทเหล่านี้ไม่ได้มีความเข้าใจในภาษาธรรมชาติอย่างแท้จริง แต่ตอบสนองตามรูปแบบที่ถูกโปรแกรมไว้เท่านั้น
eliza_first_chatbot

Image Source: https://community.neontools.io/chatbots/

โดยสรุป Rule-Based AI หรือ Symbolic AI เป็นเหมือน “หุ่นยนต์ตามคำสั่ง” ที่ทำงานได้ดี ในงานที่มีกฎเกณฑ์ชัดเจนและคาดการณ์ได้ แต่มีข้อจำกัดในการจัดการกับสถานการณ์ใหม่ๆ หรือข้อมูลที่ไม่ตรงกับกฎที่ตั้งไว้


2. ระบบที่เรียนรู้ได้ด้วยตัวเอง (Machine Learning – ML)

การเรียนรู้ของเครื่องเป็นแขนงหนึ่งของปัญญาประดิษฐ์ ที่มุ่งเน้นการพัฒนาระบบที่สามารถเรียนรู้จากชุดข้อมูลขนาดใหญ่ และปรับปรุงความสามารถในการคาดการณ์ หรือตัดสินใจได้ด้วยตนเองเมื่อเวลาผ่านไป โดยไม่ต้องมีการตั้งโปรแกรมคำสั่งอย่างชัดเจนสำหรับทุกสถานการณ์ แทนที่จะป้อนกฎเกณฑ์ที่ตายตัวเหมือนใน Rule-Based AI แต่ ML ให้เสมือนกับป้อนอาหารให้กับระบบด้วยข้อมูลจำนวนมาก และปล่อยให้ระบบค้นหารูปแบบ และความสัมพันธ์ที่ซ่อนอยู่ในข้อมูลเหล่านั้นเอง เหมือนกับการสอนเด็กโดยการให้ตัวอย่างมากมาย แทนที่จะบอกกฎทุกอย่าง ระบบ ML จะค่อยๆปรับปรุงโมเดลของตัวเองเมื่อได้รับข้อมูลใหม่ ทำให้สามารถทำงานที่ซับซ้อนและปรับตัวได้ดีกว่า Rule-Based AI ML ซึ่งถือเป็นรากฐานสำคัญของ AI Application / Platform จำนวนมากในปัจจุบัน โดยแบ่งย่อยออกได้อีก 3 ประเภท ดังนี้

  • การเรียนรู้แบบมีผู้สอน (Supervised Learning)
    ในการเรียนรู้ประเภทนี้ ระบบจะได้รับการฝึกฝนด้วยชุดข้อมูลที่มีป้ายกำกับ (Labeled Data) ซึ่งหมายความว่า สำหรับข้อมูลนำเข้าแต่ละรายการ จะมีคำตอบหรือผลลัพธ์ที่ถูกต้องกำกับไว้ ตัวอย่างเช่น ในการฝึกระบบจำแนกภาพแมวและสุนัข รูปภาพแต่ละรูปจะถูกกำกับว่าเป็น “แมว” หรือ “สุนัข” ระบบจะเรียนรู้ความสัมพันธ์ ระหว่างคุณสมบัติของภาพกับป้ายกำกับเหล่านี้ เพื่อให้สามารถจำแนกภาพใหม่ที่ไม่เคยเห็นมาก่อนได้
  • การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning)
    ในการเรียนรู้ประเภทนี้ ระบบจะได้รับการฝึกฝนด้วยชุดข้อมูลที่ไม่มีป้ายกำกับ (Unlabeled Data) โดยมีเป้าหมายคือ ให้ระบบค้นหาโครงสร้าง รูปแบบ หรือความสัมพันธ์ที่ซ่อนอยู่ในข้อมูลด้วยตัวเอง ตัวอย่างเช่น การจัดกลุ่มลูกค้าที่มีพฤติกรรมการซื้อที่คล้ายคลึงกัน หรือการค้นหาความผิดปกติในข้อมูล
  • การเรียนรู้แบบเสริมกำลัง (Reinforcement Learning)
    ในการเรียนรู้ประเภทนี้ ระบบจะเรียนรู้โดยการลองผิดลองถูกในสภาพแวดล้อมหนึ่ง ระบบจะได้รับรางวัล (Reward) เมื่อทำการตัดสินใจที่ถูกต้อง และถูกลงโทษ (Penalty) เมื่อทำการตัดสินใจที่ผิดพลาด โดยมีเป้าหมายคือ การเรียนรู้นโยบาย (Policy) ที่จะทำให้ได้รับรางวัลสะสมสูงสุด ตัวอย่างเช่น การฝึกหุ่นยนต์ให้เดิน หรือการพัฒนาระบบเล่นเกม

ตัวอย่างของ Machine Learning ที่เราคุ้นเคย เช่น

  • Google Translate กับการเรียนรู้รูปแบบภาษา
    Google Translate ใช้กระบวนการ Machine Learning เพื่อเรียนรู้ความสัมพันธ์ระหว่างภาษาต่างๆ จากชุดข้อมูลการแปลขนาดใหญ่ ทำให้สามารถแปลข้อความจากภาษาหนึ่ง ไปยังอีกภาษาหนึ่งได้อย่างเป็นธรรมชาติมากขึ้น โดยไม่ได้อาศัยกฎการแปลที่ตายตัวเท่านั้น
  • Netflix Recommendations กับการแนะนำตามพฤติกรรมการรับชม
    ระบบแนะนำภาพยนตร์และรายการทีวีของ Netflix ใช้ Machine Learning เพื่อวิเคราะห์พฤติกรรมการรับชมของผู้ใช้แต่ละคน รวมถึงข้อมูลของผู้ใช้ที่มีความชอบคล้ายกัน เพื่อคาดการณ์ว่าผู้ใช้น่าจะสนใจเนื้อหาใดต่อไป
  • Scikit-learn เครื่องมือ ML บน Python
    Scikit-learn ถือเป็นห้องสมุด Python ที่ได้รับความนิยมอย่างมาก ซึ่งมีเครื่องมือและอัลกอริธึมที่หลากหลาย สำหรับการใช้งาน Machine Learning เช่น การจำแนก การถดถอย การจัดกลุ่ม และการลดมิติของข้อมูล ทำให้ผู้พัฒนาสามารถสร้างและทดลองโมเดล ML ต่างๆได้ง่ายขึ้น
Google_Translate_Screen
plot_classifier_comparison_Scikit-learn

Image Source: https://scikit-learn.org/

โดยสรุปแล้ว Machine Learning เป็นแนวทางที่สำคัญในการสร้างระบบ AI ที่มีความยืดหยุ่น สามารถเรียนรู้และปรับปรุงได้เมื่อมีข้อมูลมากขึ้น ทำให้สามารถนำไปประยุกต์ใช้ในงานที่ซับซ้อน และมีการเปลี่ยนแปลงอยู่เสมอ ซึ่งแตกต่างจาก Rule-Based AI ที่มีความแข็งกระด้างและไม่สามารถเรียนรู้ได้ด้วยตนเอง


3. ปัญญาประดิษฐ์เชิงสร้างสรรค์ (Generative AI – GenAI)

ปัญญาประดิษฐ์เชิงสร้างสรรค์เป็นประเภทของ AI ที่มีความสามารถในการสร้างเนื้อหาใหม่ๆ โดยอิงจากรูปแบบข้อมูลที่ได้เรียนรู้มา GenAI สามารถสร้างสรรค์ผลลัพธ์ได้หลากหลายรูปแบบ ไม่ว่าจะเป็นข้อความ รูปภาพ วิดีโอ ดนตรี และอื่นๆ ที่เปรียบเสมือนศิลปินบนโลกดิจิทัลที่ได้รับการฝึกฝน บนคลังข้อมูลขนาดใหญ่ของผลงานเดิมที่มีอยู่แล้ว (เช่น ข้อความจากหนังสือ เว็บไซต์ รูปภาพนับล้าน วิดีโอหลากหลายประเภท เพลงจากแนวเพลงต่างๆ) จากนั้น AI จะเรียนรู้ลักษณะเฉพาะ รูปแบบ และสไตล์ของข้อมูลเหล่านั้น แล้วสามารถนำมาสร้างสรรค์สิ่งใหม่ๆที่ไม่เคยมีมาก่อนได้ ความน่าทึ่งของ GenAI ก็คือ ความสามารถในการสร้างสรรค์ผลงาน ที่มีความซับซ้อนและมีความหลากหลายสูง โดยแบ่งออกมาได้อีก 6 กลุ่ม/รูปแบบ คือ

  1. การสร้างข้อความ (Text Generation)
  • ChatGPT (OpenAI)
    ChatGPT ถือเป็นเป็นโมเดลภาษาขนาดใหญ่ ที่สามารถสร้างข้อความได้หลากหลายรูปแบบ ตั้งแต่การเขียนอีเมล์ บทความ บทภาพยนต์ การเขียนโพสต์ สรุปเนื้อหา ไปจนถึงการให้คำแนะนำในการเขียนโค้ด และอื่นๆ
  • Claude (Anthropic)
    Claude เป็นอีกหนึ่งโมเดลภาษาขนาดใหญ่ ที่เน้นความสามารถในการสร้างสรรค์เนื้อหา ในรูปแบบยาวที่มีความซับซ้อน และได้รับการออกแบบมาให้มีการสนทนา ที่เป็นประโยชน์และคำนึงถึงประเด็นทางจริยธรรม  

    โดยมีรูปแบบผลลัพธ์ทั่วไปของ Text Generation อย่างเช่น .txt (ข้อความธรรมดา), .docx (เอกสาร Microsoft Word), .pdf (เอกสาร Portable Document Format), .md (Markdown), .html (HyperText Markup Language)

    ตัวอย่าง AI รูปแบบ Text Generation ที่โดดเด่น เช่น ChatGPT, Jasper AI. Copy.ai, Zanroo AI, Botnoi AI
Screenshot_of_ChatGPT

Image Source: chatgpt.com


  1. การสร้างภาพจากข้อความ (Text-to-Image)
  • เทคโนโลยีนี้เป็นเหมือน “จิตรกร AI” ที่สามารถสร้างภาพใหม่ได้ เพียงแค่คุณป้อนคำอธิบายเป็นข้อความ (Prompt) โดย AI เหล่านี้ได้รับการฝึกฝนบนชุดข้อมูลภาพ และคำอธิบายจำนวนมหาศาล ทำให้พวกมันเข้าใจความสัมพันธ์ระหว่างคำศัพท์ต่างๆกับลักษณะของภาพ เมื่อคุณป้อนข้อความ เช่น “แมวใส่หมวกกันน็อคปั่นจักรยานบนดวงจันทร์” AI ก็จะประมวลผลคำเหล่านั้นและสร้างภาพ ที่ไม่เคยมีอยู่จริงตามคำอธิบายของคุณ
  • ความสามารถนี้เปิดโอกาสใหม่ๆในหลายด้าน เช่น การสร้างภาพประกอบที่ไม่ซ้ำใครสำหรับบทความหรือเรื่องราว การสร้างงาน Digital Art ที่ไม่จำเป็นต้องมีทักษะการวาดภาพขั้นสูง การสร้างแบบจำลองผลิตภัณฑ์อย่างรวดเร็ว โดยไม่ต้องเสียเวลาถ่ายภาพจริง หรือแม้แต่การสร้างภาพคอนเซ็ปต์สำหรับภาพยนตร์และวิดีโอเกม

    โดยมีรูปแบบผลลัพธ์ทั่วไปของ Text Generation อย่างเช่น .jpg (JPEG), .png (Portable Network Graphics), .webp (Web Picture format), .svg (Scalable Vector Graphics)

    ตัวอย่าง AI รูปแบบ Text Generation ที่โดดเด่น เช่น DALL·E, Midjourney, Stable Diffusion, MePrompt, Canva
Screenshot_of_MidJournry

Image Source: midjourney.com


  1. การแก้ไขภาพ/เติมเต็มภาพ (Image-to-Image / Inpainting)
  • เทคโนโลยีนี้ต่อยอดจากความสามารถในการสร้างภาพ โดยอนุญาตให้ผู้ใช้สามารถอัปโหลดภาพที่มีอยู่แล้ว และใช้ข้อความสั่งให้ AI แก้ไข ปรับปรุง หรือเติมเต็มส่วนที่ขาดหายไปของภาพได้
    • Image-to-Image
      คุณสามารถอัปโหลดภาพถ่ายและใช้ข้อความสั่งให้ AI เปลี่ยนสไตล์ของภาพ (เช่น เปลี่ยนภาพถ่ายให้เป็นภาพวาดสีน้ำมัน) หรือปรับเปลี่ยนองค์ประกอบบางอย่างในภาพได้
    • Inpainting
      คุณสามารถเลือกพื้นที่ที่ต้องการแก้ไขในภาพ (เช่น ลบวัตถุที่ไม่ต้องการ หรือซ่อมแซมส่วนที่เสียหาย) แล้วใช้ข้อความสั่งให้ AI เติมเต็มพื้นที่นั้นอย่างสมจริง โดยอิงจากบริบทของภาพโดยรวม
  • ความน่าสนใจ คือ เครื่องมือเหล่านี้มีประโยชน์อย่างมาก สำหรับการปรับปรุงคุณภาพของภาพถ่าย การลบสิ่งรบกวนสายตา การสร้างภาพที่มีองค์ประกอบที่ต้องการ หรือแม้แต่การฟื้นฟูภาพถ่ายเก่าที่ชำรุด โดยมีรูปแบบผลลัพธ์ทั่วไปของ Image-to-Image อย่างเช่น .psd (Adobe Photoshop Document), .png (Portable Network Graphics), .jpg (JPEG)

    ตัวอย่าง AI รูปแบบ Image-to-Image ที่โดดเด่น เช่น Adobe Firefly, Stable Diffusion, Runway ML
Adobe_Firefly

Image Source: https://www.adobe.com/th_en/products/firefly.html


  1. การสร้างวิดีโอ (Video Generation)
  • เทคโนโลยีนี้เป็นเหมือน “ผู้กำกับ AI” ที่สามารถสร้างวิดีโอคลิปใหม่ได้จากข้อความสั่ง หรือจากภาพนิ่งและคำอธิบายเพิ่มเติม แม้ว่าเทคโนโลยีนี้จะยังอยู่ในช่วงเริ่มต้น และยังไม่สมบูรณ์เท่าการสร้างภาพ แต่ก็มีความก้าวหน้าอย่างรวดเร็ว โดยแบ่งเป็น 2 รูปแบบย่อย คือ
    • Text-to-Video: คุณสามารถป้อนคำอธิบายเป็นข้อความ เช่น “หุ่นยนต์เดินเล่นในเมืองอนาคต” และ AI จะพยายามสร้างวิดีโอสั้นๆ ที่แสดงภาพตามคำอธิบายนั้น
    • Image-to-Video: บางเครื่องมืออนุญาตให้อัปโหลดภาพนิ่งและใช้ข้อความสั่งเพื่อทำให้ภาพนั้นเคลื่อนไหว หรือเพิ่มองค์ประกอบเคลื่อนไหวเข้าไป
  • ความน่าสนใจ คือ ศักยภาพของเทคโนโลยีนี้มีมากมาย ตั้งแต่การสร้างโฆษณาสั้นๆ วิดีโอสอนให้ความรู้ Animation หรือในอนาคตอาจทำออกมาเป็นภาพยนต์ได้แล้ว โดยไม่ต้องมีทีมงานถ่ายทำและตัดต่อวิดีโอแบบดั้งเดิม นอกจากนี้ยังสามารถช่วยในการสร้างภาพจำลอง หรือสถานการณ์เสมือนจริงได้อีกด้วย โดยมีรูปแบบผลลัพธ์ทั่วไปของ Video Generation อย่างเช่น .mp4 (MPEG-4 Part 14), .mov (QuickTime Movie), .webm (WebM), .gif (Graphics Interchange Format)

    ตัวอย่าง AI รูปแบบ Video Generation ที่โดดเด่น เช่น Sora (OpenAI), Synthesia, Runway Gen-2, HeyGen, Veed.io, Animoto, FlexClip
Screenshot_of_HeyGen

Image Source: https://www.heygen.com/


  1. การสร้างเสียง/ดนตรีจากข้อความ (Text-to-Music / Sound)
  • เทคโนโลยีนี้เป็นเหมือน “นักแต่งเพลง AI” ที่สามารถสร้างสรรค์ดนตรี หรือเอฟเฟกต์เสียงใหม่ๆ ได้จากคำอธิบายข้อความ โดยคุณสามารถป้อนคำสั่ง เช่น “เพลงบรรเลงเปียโนสไตล์คลาสสิกที่ให้ความรู้สึกสงบ” หรือ “เสียงฝีเท้าบนพื้นไม้” และ AI จะพยายามสร้างเสียงหรือดนตรีที่ตรงกับคำอธิบายนั้น
  • ความน่าสนใจ คือ เทคโนโลยีนี้มีประโยชน์สำหรับผู้สร้างคอนเทนต์ ที่ต้องการเพลงประกอบหรือเอฟเฟกต์เสียงที่ไม่ซ้ำใครสำหรับวิดีโอ เกม หรือแอปพลิเคชัน โดยไม่ต้องมีความรู้ด้านดนตรีขั้นสูง นอกจากนี้ยังสามารถเป็นเครื่องมือ ที่เอาไว้ช่วยในการสร้างสรรค์สำหรับนักดนตรีอีกด้วย โดยมีรูปแบบผลลัพธ์ทั่วไปของ Text-to-Music / Sound อย่างเช่น .mp3 (MPEG-1 Audio Layer III), .wav (Waveform Audio File Format), .ogg (Ogg Vorbis), .midi (Musical Instrument Digital Interface)

    ตัวอย่าง AI รูปแบบ Text-to-Music / Sound ที่โดดเด่น เช่น Suno.ai, Google MusicLM, Soundraw, Aiva
Screenshot_of_suno_ai

Image Source: https://suno.com


  1. การสร้างโค้ด (Code Generation)
  • เทคโนโลยีนี้เป็นเหมือน “AI Programmer” ที่สามารถสร้างโค้ดโปรแกรมในภาษาต่างๆ โดยคุณสามารถบอก AI ว่าต้องการให้โปรแกรมทำอะไร เช่น “สร้างฟังก์ชัน Python ที่เรียงลำดับตัวเลขในรายการ” และ AI จะพยายามสร้างโค้ดที่สามารถทำงานตามความต้องการนั้นได้
  • ความน่าสนใจ คือ เครื่องมือเหล่านี้สามารถช่วยเพิ่มประสิทธิภาพในการพัฒนาซอฟต์แวร์ ลดเวลาในการเขียนโค้ดซ้ำๆ ช่วยผู้ที่ไม่มีพื้นฐานด้านการเขียนโปรแกรม ให้สามารถสร้างเครื่องมือหรือแอปพลิเคชันง่ายๆได้ และเป็นเครื่องมือที่มีประโยชน์สำหรับนักพัฒนา ในการสร้างต้นแบบอย่างรวดเร็ว หรือค้นหาวิธีการเขียนโค้ดในบางสถานการณ์ โดยมีรูปแบบผลลัพธ์ทั่วไปของ Code Generation อย่างเช่น .py (Python), .js (JavaScript), .html (HyperText Markup Language), .css (Cascading Style Sheets), .json (JavaScript Object Notation), .ipynb (Jupyter Notebook)

    ตัวอย่าง AI รูปแบบ Code Generation ที่โดดเด่น เช่น GitHub Copilot, Replit AI, ChatGPT with Code Interpreter
Screenshot_of_GitHub_Copilot

Image Source: https://github.com/features/copilot


4. ปัญญาประดิษฐ์เชิงสนทนา (Conversational AI)

ปัญญาประดิษฐ์เชิงสนทนา คือ ระบบ AI ที่ได้รับการออกแบบมาเพื่อจำลองการสนทนากับมนุษย์ โดยใช้การประมวลผลภาษาธรรมชาติ (Natural Language Processing – NLP) ระบบเหล่านี้มีความสามารถในการเข้าใจ และตอบสนองต่อภาษาที่เราใช้ในชีวิตประจำวัน ไม่ว่าจะเป็นข้อความหรือเสียงพูด ลองนึกภาพว่าคุณกำลังคุยกับเพื่อนหรือผู้ช่วยที่เป็นมนุษย์ Conversational AI พยายามที่จะเลียนแบบประสบการณ์นั้น โดยการทำความเข้าใจสิ่งที่คุณพูดหรือพิมพ์เข้าไป ตีความความหมาย จับบริบทของการสนทนา สร้างคำตอบที่เหมาะสมและเป็นธรรมชาติออกมา ระบบเหล่านี้มักจะใช้เทคนิค Machine Learning (ML) โดยเฉพาะอย่างยิ่ง Deep Learning เพื่อเรียนรู้รูปแบบของภาษา และความหมายจากข้อมูลการสนทนาจำนวนมาก ทำให้พวกเขาสามารถจัดการกับคำถามและหัวข้อที่หลากหลายได้ ตัวอย่างเช่น

  • ChatGPT, Google Gemini
    โมเดลภาษาขนาดใหญ่นี้เป็นหนึ่งตัวอย่างที่โดดเด่นของ Conversational AI ที่สามารถเข้าใจและสร้างข้อความที่ซับซ้อน ตอบคำถาม ให้ข้อมูล สรุปเนื้อหา ช่วยเขียนบทความ หรือแม้กระทั่งสร้างโค้ดได้
  • Alexa (Amazon), Siri (Apple)
    ผู้ช่วยเสมือนเป็น Conversational AI ที่ถูกออกแบบมาเพื่อตอบสนองต่อคำสั่งเสียง ให้ข้อมูล ตั้งเวลาปลุก เล่นเพลง ควบคุมอุปกรณ์สมาร์ทโฮม และอื่นๆ โดยมีความสามารถในการเข้าใจภาษาพูด และตอบกลับด้วยเสียง
  • Chatbot
    บริษัทต่างๆมักจะใช้ Conversational AI ในรูปแบบของแชทบอท บนเว็บไซต์หรือแอปพลิเคชัน เพื่อตอบคำถามลูกค้า ให้ความช่วยเหลือเบื้องต้น หรือนำทางไปยังข้อมูลที่ต้องการ

โดยมีรูปแบบผลลัพธ์ทั่วไปของ Conversational AI อย่างเช่น

  • การตอบกลับเป็นข้อความหรือบทสรุป (.txt, .docx) ซึ่งเป็นรูปแบบการตอบกลับที่พบได้บ่อยที่สุด
  • การถอดเสียง (.srt, .vtt, .pdf) สำหรับกรณีของการประมวลผลเสียงพูด ระบบสามารถถอดเสียงออกมาเป็นข้อความในรูปแบบไฟล์ต่างๆ
  • บันทึกการดำเนินการหรือการตอบกลับด้วยเสียง (.mp3, .wav) สำหรับผู้ช่วยเสมือนที่โต้ตอบด้วยเสียง พวกเขาจะให้ผลลัพธ์เป็นไฟล์เสียง หรือบันทึกการดำเนินการที่พวกเขาได้ทำ
Siri_Apple

Image Source: https://www.apple.com/th/siri/


5. หน่วยปฏิบัติการอัตโนมัติ (Autonomous Agents หรือ Agentic AI)

หน่วยปฏิบัติการอัตโนมัติ คือ ระบบ AI ที่สามารถดำเนินงานต่างๆได้ด้วยตนเอง โดยอิงตามเป้าหมาย บริบท และตรรกะที่ถูกกำหนดไว้ พวกมันมีความสามารถในการวางแผน ตัดสินใจ และดำเนินการ โดยแทบไม่ต้องมีการแทรกแซงจากมนุษย์โดยตรง เมื่อได้รับมอบหมายเป้าหมายแล้ว ลองจินตนาการถึงผู้ช่วยอัจฉริยะ (AI Assistant) ที่ไม่เพียงแต่ตอบคำถามหรือทำตามคำสั่งง่ายๆ แต่ยังสามารถรับมอบหมายเป้าหมายที่ซับซ้อนกว่านั้นได้ เช่น “ทำการวิเคราะห์แนวโน้มตลาดล่าสุดสำหรับรถยนต์ไฟฟ้า และนำเสนอรายงานสรุปพร้อมข้อเสนอแนะ” จากนั้น Autonomous Agent หรือ Agentic AI จะสามารถวางแผนขั้นตอนต่างๆที่จำเป็นในการบรรลุเป้าหมายนี้ ตั้งแต่การค้นหาข้อมูล การวิเคราะห์ข้อมูล ไปจนถึงการเขียนรายงาน โดยที่มนุษย์มีหน้าที่เพียงแค่กำหนดเป้าหมายในตอนแรก และตรวจสอบผลลัพธ์ในภายหลัง

ระบบ AI นี้มีความสามารถในการรับรู้สภาพแวดล้อม (Context) เข้าใจเป้าหมายที่ได้รับมอบหมาย วางแผนลำดับการทำงาน ตัดสินใจว่าจะดำเนินการอย่างไร และดำเนินการตามแผนนั้น และยังงสามารถเรียนรู้จากประสบการณ์ และปรับปรุงวิธีการทำงานของตัวเองได้เมื่อเวลาผ่านไปได้อีก ตัวอย่างเช่น

  • AutoGPT, BabyAGI
    โครงการ Open Source เหล่านี้เป็นตัวอย่างแรกๆของ Autonomous Agents ที่ได้รับความสนใจอย่างมาก พวกมันสามารถถูกตั้งค่าด้วยเป้าหมายกว้างๆ และจะพยายามบรรลุเป้าหมายนั้นโดยการสร้างและดำเนินการตาม “ความคิด” หรือขั้นตอนต่างๆด้วยตนเอง เช่น การค้นหาข้อมูลออนไลน์ การเขียนโค้ด หรือการโต้ตอบกับเครื่องมืออื่นๆ
  • Custom GPTs (บนแพลตฟอร์ม ChatGPT)
    ผู้ใช้สามารถสร้าง GPTs ที่ปรับแต่งเองได้ โดยกำหนดวัตถุประสงค์ ความรู้ และชุดคำสั่งเฉพาะเจาะจง ทำให้ GPT เหล่านี้สามารถทำงานเฉพาะทางได้มากขึ้น เช่น การเป็นผู้ช่วยเขียนบทความในหัวข้อใดหัวข้อหนึ่ง หรือการวิเคราะห์ข้อมูลในรูปแบบเฉพาะ
  • Adept ACT-1
    เป็นตัวอย่างของ Autonomous Agent ที่มีความสามารถ ในการโต้ตอบกับแอปพลิเคชันซอฟต์แวร์ต่างๆ โดยมีเป้าหมายที่จะทำให้การทำงานกับซอฟต์แวร์ เป็นไปโดยอัตโนมัติมากขึ้น

โดยมีรูปแบบผลลัพธ์ทั่วไปของ Autonomous Agents หรือ Agentic AI อย่างเช่น

  • บันทึกการทำงาน (.txt) ที่ใช้บันทึกขั้นตอนการทำงาน การตัดสินใจ และผลลัพธ์ระหว่างการดำเนินงานของ Agent
  • ขั้นตอนการทำงาน (.json, .csv) โดยอาจแสดงลำดับของงาน หรือข้อมูลที่ถูกประมวลผลในรูปแบบโครงสร้าง
  • รายงาน (.docx, .pdf) เมื่อ Agent ทำงานวิเคราะห์หรือวิจัยเสร็จสิ้น ก็มักจะนำเสนอผลลัพธ์ในรูปแบบรายงานที่อ่านง่าย
Screenshot_of_BabyAGI

Image Source: https://babyagi-ui.vercel.app/

Autonomous Agents หรือ Agentic AI เป็นวิวัฒนาการอีกขั้นของ AI ที่ก้าวข้ามการตอบสนองต่อคำสั่งโดยตรง ไปสู่การทำงานเชิงรุกและการแก้ปัญหาด้วยตนเอง ทำให้มีศักยภาพในการปฏิวัติวิธีการทำงานในหลายอุตสาหกรรม โดยการมอบหมายงานที่ซับซ้อนและต้องใช้การตัดสินใจให้กับ AI ในระดับที่สูงขึ้นนั่นเองครับ

ตารางสรุปนามสกุลไฟล์ที่สร้างโดย AI

หมวดหมู่ประเภทไฟล์ / รูปแบบนามสกุลไฟล์ (Extension)วัตถุประสงค์ / การใช้งาน
ข้อความข้อความธรรมดา.txt, .mdบันทึกทั่วไป สคริปต์แชต บันทึกโน้ต
เอกสาร.docx, .odtรายงาน เนื้อหาบทความ ร่างข้อเสนอ
ไฟล์ PDF.pdfเอกสารที่เสร็จสมบูรณ์ รายงานอย่างเป็นทางการ
Presentation Slide.pptx, .key, .pdfพรีเซนต์ธุรกิจ สไลด์สอนงานที่ให้ AI ช่วยจัดทำ
Table / Spreadsheet.csv, .xlsx, .odsวิเคราะห์ข้อมูล รายงานผลลัพธ์ หรือการแปลงข้อมูลจาก AI
เนื้อหาบนเว็บไซต์.html, .css, xmlเนื้อหาเว็บไซต์ บล็อก รูปแบบ UI
ข้อมูลแบบมีโครงสร้าง.json, .yaml, .xmlใช้งานร่วมกับ API, Chatbot และการตั้งค่าโมเดล AI
รูปภาพRaster Image.jpg, .jpeg, .png, .bmp, .webp, .tiffภาพจาก AI สำหรับงานออกแบบ คอนเทนต์ โฆษณา หรือโพสต์โซเชียล
Vector Image.svg, .ai, .eps, .pdfโลโก้ ภาพประกอบ อินโฟกราฟิกแบบปรับขนาดได้
ไฟล์ Photoshop.psdงานดีไซน์แบบเลเยอร์ แก้ไขภาพต่อในโปรแกรม Photoshop
ภาพประสิทธิภาพสูง.heic, .heifภาพจาก iPhone หรือแอปมือถือที่ใช้ AI
เสียงไฟล์เสียงทั่วไป.mp3, .wav, .aac, .flac, .ogg, .m4aดนตรีที่สร้างโดย AI เสียงพากย์ เสียงพูดจาก TTS หรือ Podcast
ไฟล์ MIDI.mid, .midiการสร้างเพลง เครื่องดนตรีเสมือนด้วย AI
เสียงพูด (TTS) พร้อม Metadata.json (พร้อมข้อมูลเสียง)ผลลัพธ์จากระบบอ่านออกเสียง เช่น ElevenLabs, Azure Speech
วิดีโอไฟล์วิดีโอมาตรฐาน.mp4, .mov, .avi, .mkv, .webmวิดีโอที่สร้างจาก AI เช่น คลิปสั้น สื่อการเรียน
Animation / GIF .gif, .apngAnimation และภาพเคลื่อนไหวจาก AI
ไฟล์โปรเจกต์วิดีโอ.prproj, .aep, .drpProject Editor จาก Premiere Pro, After Effects หรือ DaVinci Resolve
3D / XR / การออกแบบโมเดล 3 มิติ.obj, .fbx, .glb, .gltf, .stlโมเดลจาก AI สำหรับ AR/VR เกม หรือสถาปัตยกรรม
ฉากและเลย์เอาท์.usd, .usdz, .blendใช้ใน AR (Apple) การแชร์ฉาก 3D
การออกแบบใน Blender
งาน CAD / วิศวกรรม.step, igesการออกแบบทางอุตสาหกรรมโดยใช้ AI
การเขียนโค้ด /
การพัฒนาโปรแกรม
Source Code.py, .js, .ts, .cpp, .java, .htmlโค้ดจาก AI สำหรับ Software Projects การเขียนสคริปต์ หรือระบบอัตโนมัติ
Notebooks.jpynbไฟล์สำหรับการวิเคราะห์ข้อมูลด้วย Python
และ ML
Script Automation.sh, .bat, .ps1สคริปต์สำหรับการทำงานอัตโนมัติ Deployment หรือ DevOps
การวิเคราะห์แผนภูมิ / กราฟ.png, .svg, .pdf, .pptxแผนภูมิจาก AI เช่นการวิเคราะห์จาก ChatGPT + Advanced Data Analytics
ข้อมูลการวิเคราะห์.csv, .json, .xlsxการประมวลผลแบบเชิงลึก การพยากรณ์ การทำเซ็กเมนต์ลูกค้า
Specialized AIAI Model Weights.bin, .pt, .ckpt, safetensorsไฟล์สำหรับ Trained Weights Model เช่น GPT, LLaMA, Stable Diffusion
ไฟล์ ONNX.onnxใช้สำหรับโมเดล AI แบบข้ามแพลตฟอร์ม
Prompt / Workflow Data.json, .yaml, .pklระบบ workflow เช่น LangChain, Flowise และการตั้งค่าระบบ AI อื่นๆ

ในตอนนี้เราจะเห็นว่า Generative AI บางแพลตฟอร์ม ก็สามารถทำได้หลากหลายอย่างพร้อมกัน และมีหลากหลายประเภทของ AI ซ่อนอยู่เบื้องหลังการทำงาน อย่างเช่น FlexClip และแฟลตฟอร์มอื่นๆในตลาด ซึ่งเป็นแพลตฟอร์มตัดต่อวีดิโอออนไลน์ (Online Video Editor Platform) ที่มีขีดความสามารถหลากหลายอย่าง เช่น

  • การสร้างวิดีโอจากข้อความ (AI Text-to-Video)
  • การแปลงบทความบล็อกเป็นวิดีโอ (Blog-to-Video)
  • การสร้างวิดีโอจากบท (Script-to-Video)
  • โปรแกรมแปลภาษา (AI Translator)
  • การสร้างคำบรรยายใต้ภาพอัตโนมัติ (Auto Subtitles)
  • การแปลงข้อความเป็นเสียงพูด (AI Text-to-Speech)
  • โปรแกรมสร้างภาพ (AI Image Generator)
  • การสลับใบหน้า (AI Face-swap)
  • การขยายภาพด้วย (AI Image-extender)
  • การเพิ่มความละเอียดภาพ (AI Image-upscaler)
  • การใส่สีให้ภาพถ่ายขาวดำ (AI Photo Colorizer)
  • การบูรณะภาพถ่ายเก่าด้วย (AI Old Photo Restoration)
  • Royalty-Free Stock นับล้านรายการ รวมถึงภาพถ่าย วิดีโอ และเพลง
  • การปรับแต่งวีดิโอได้หลากหลายแบบ เช่น Speed Curve, Freeze Frame, Split Screen Video, Reverse Video และ Chroma Key
  • รวมถึง Template ต่างๆ

หากสนใจเรียนรู้ลองเข้าไปดูตัวอย่างได้ที่นี่ครับ >>> https://www.flexclip.com/

FlexClip_AI_Video_Editor

Image Source: https://www.flexclip.com/


ปัจจุบันต้องยอมรับเลยครับว่า AI ไม่ได้เป็นเพียงแค่การเลียนแบบสติปัญญาอีกต่อไป แต่เป็นการยกระดับความคิดสร้างสรรค์ ผลผลิต และประสิทธิภาพ ด้วยความสามารถในการสร้างผลลัพธ์ ในรูปแบบที่หลากหลาย AI จึงกลายเป็นเครื่องมืออเนกประสงค์สำหรับนักเขียน นักออกแบบ นักพัฒนา นักการตลาด นักดนตรี และอีกมากมาย ที่จำเป็นต้องเรียนรู้ไปตลอดนั่นเอง


Source
Source
Source

Share to friends


Related Posts

รวม Generative AI ทั้ง 7 หมวดหมู่สำหรับการใช้งานในยุคดิจิทัล

Generative AI หรือ Generative Artificial Intelligence คือ AI หรือปัญญาประดิษฐ์ประเภทหนึ่งที่สามารถสร้างผลลัพธ์ใหม่ๆ มีความสามารถในการคิดอย่างสร้างสรรค์ที่อาจนอกเหนือจากขอบเขตที่มนุษย์จะคิดได้ Generative AI สามารถสร้างผลลัพธ์ได้หลากหลายรูปแบบที่นอกเหนือจากการตอบสนองต่อข้อความ


วิธีเขียน Prompt กับการวาดภาพด้วย AI

AI ได้เข้ามามีบทบาทอย่างเต็มรูปแบบกับการทำการตลาดรวมถึงอีกหลายหลายอุตสาหกรรม ซึ่งทำให้การทำงานนั้นออกมาง่ายมากขึ้นโดยเฉพาะอย่างยิ่งการเปิดตัวของ ChatGPT นั้นยิ่งทำให้กระแสของการใช้ AI ได้กลายเป็นส่วนหนึ่งของการทำงานอย่างหลีกเลี่ยงไม่ได้ ในบทความนี้ไม่ได้พูดถึงเรื่องของการเขียน Prompts


Generative AI พลิกโฉม “ประสบการณ์ลูกค้า” ได้อย่างไร

Generative AI ได้กลายเป็นหนึ่งในเทคโนโลยีที่น่าตื่นเต้นที่สุดและก่อให้เกิดความเปลี่ยนแปลงอย่างกว้างขวางภายในเวลาอันรวดเร็ว แอพพลิเคชั่นที่ออกมาในช่วงแรกๆ ช่วยให้ผู้ใช้ในทุกระดับทักษะสามารถพิมพ์ป้อนคำสั่งสั้นๆ และสร้างรูปภาพที่สวยงามหรือข้อความที่ซับซ้อน นอกจากนี้ นักการตลาดกำลังใช้ประโยชน์จากเทคโนโลยีนี้เพื่อสร้างคอนเทนต์ SEO



copyright 2025@popticles.com
หากท่านต้องการนำเนื้อหาในเว็บไซต์นี้ไปเผยเพร่ ต้องได้รับอนุญาตจากเจ้าของเว็บไซต์