เจาะลึก Generative AI ตอนที่ 2: Stable Diffusion vs Midjourney vs DALL·E แตกต่างกันอย่างไร?
ต่อเนื่องจากโพสก่อน (Link อยู่ด้านล่างสุด) ที่เราได้เกริ่นถึง Stable Diffusion กันไปแล้วว่าเป็นหนึ่งใน Generative AI ที่สามารถ Generate ภาพได้ และกำลังจะเข้ามา Disrupt วงการ Concept Designer ในอนาคต โดยเมื่อไหร่ที่ธุรกิจส่วนใหญ่เริ่มหันมาใช้ AI ช่วยทำ Concept Art ก็จะประหยัด Cost และเวลาการทำงานได้อย่างมาก ทำให้คนในตำแหน่งระดับ Entry มีโอกาสตกงานสูงขึ้น
.
ในปัจจุบันนอกจาก Stable Diffusion แล้วยังมี AI สำหรับ Generate ภาพอีกเพียบ เช่น Midjourney ที่มียอดคนใช้มากที่สุดตอนนี้ และ DALL·E ของ OpenAI เจ้าของผู้สร้าง ChatGPT นั่นเอง ซึ่งวันนี้เราจะมาดูกันว่าแต่ละเจ้ามีอะไรที่เหมือนหรือแตกต่างกันตรงไหนบ้าง
.
ราคา (Price and Availability)
Stable Diffusion เป็น Open-source ที่โหลดไปติดตั้งใช้งานกันได้ฟรีๆ แต่อาจต้องเสียเงินให้กับการหาการ์ดจอแรงๆมาใช้ใน PC ที่บ้าน รวมถึงค่าไฟที่จะสูงขึ้นตามมา เพราะการ Generate ภาพนั้นจะรีดการ์ดจอให้ทำงานเต็มที่ 100% ขณะที่ Midjourney และ DALL·E จะเรียกเก็บเงินจากการใช้งานบน Cloud
.
เราสามารถเข้าใช้ Midjourney ได้ใน Discord แพลตฟอร์ม Community ที่เราคุ้นเคยกันดี โดยเราสามารถเลือกทดลองใช้ หรือจ่าย Subscription รายเดือน/รายปีก็ได้ มีราคาตั้งแต่ $10 – $60 ต่อเดือน
.
ขณะที่ DALL·E นั้นเราต้องซื้อ Credit เพื่อใช้ Generate ภาพ ยิ่งภาพมีความละเอียดสูงจะยิ่งใช้ Credit เยอะ DALL·E มีราคาเริ่มต้นอยู่ที่ $15 ต่อ 115 credit ซึ่งพอใช้ Generate ภาพได้ราว 460 ภาพ
.
จำนวนโมเดล (Model)
Model คือชุดข้อมูลที่เทรนมาแล้ว ซึ่งมีหลากหลายสไตล์ภาพตามที่นำมาเทรน โดย Stable Diffusion มีโมเดลจากทั้งผู้พัฒนาและ Developer ทั่วโลกรวมเกินกว่า 1,000 โมเดลในหลากหลายอาร์ตสไตล์
.
ขณะที่ Midjourney มีโมเดลที่มาจากผู้พัฒนาเองอยู่ราวๆ 10 โมเดล เช่นเดียวกัน DALL·E ที่ยังอยู่ในช่วงทดสอบ ก็ไม่ได้เปิดให้เราเลือกโมเดลได้ มีเพียงตัว DALL·E 2 ที่เป็นเวอร์ชั่นล่าสุดให้เราใช้กันเท่านั้น
.
ฟีเจอร์และความสามารถ (Customization)
Stable Diffusion นั้นจะมีความยากตั้งแต่การติดตั้งไปจนถึงการใช้งานค่อนข้างมากกว่า AI ตัวอื่น แต่โดยรวมแล้ว Stable Diffusion สามารถตั้งค่า Parameter ต่างๆในการ Generate ได้เยอะและมีฟีเจอร์มากกว่า AI ตัวอื่น ขณะที่ Midjourney และ DALL-E นั้นจะใช้งานง่ายกว่า ไม่ต้องติดตั้งอะไรให้ยุ่งยาก เลยทำให้คนทั่วไปนิยมใช้สองตัวนี้มากกว่า
.
คุณภาพ (Image Quality)
Stable Diffusion ยังคงมีปัญหาเรื่องคุณภาพของรูปซึ่งด้อยกว่า Midjourney และ DALL-E โดยเฉพาะการ Generate รูปคนที่ติดมือ แขน และขามาด้วย ส่วนหนึ่งเป็นเพราะ Dataset ที่ Stable Diffusion ใช้เทรนนั้นไม่ได้คุณภาพแต่แรก ขณะที่ Midjourney แม้อาร์ตสไตล์จะไม่หลากหลาย แต่คุณภาพของรูปที่ Generate ออกมานั้นสวยงามตั้งแต่ครั้งแรก เช่นเดียวกับ DALL-E
.
ลิขสิทธิ์ภาพ (License)
สำหรับเรื่องลิขสิทธิ์ทางภาครัฐเช่นใน US เอง ยังไม่มีกฎหมายมาคุ้มครองภาพที่ถูกสร้างขึ้นโดย AI ทำให้เรามักจะเห็นศิลปินนักวาดออกมาเรียกร้องและฟ้องบริษัทผู้พัฒนา AI ว่าขโมยภาพของตัวเองไปเทรนกันอยู่บ้าง ขณะเดียวกันฝั่งคนที่ใช้ AI Generate ภาพออกมา ก็อาจอ้างสิทธิ์ในภาพ AI ของตัวเองไม่ได้ หากถูกคนอื่นขโมยภาพไปขายต่อ เพราะกฎหมายตอนนี้ยังคลุมเคลืออยู่นั่นเอง
.
ทั้งหมดนี้เป็นเพียงตัวอย่างส่วนหนึ่งที่เรายกมาเท่านั้น ความจริงยังมีข้อเหมือนและข้อแตกต่างอยู่อีกมากในรายละเอียด แต่ที่สำคัญยุคของ Generative AI พึ่งจะเริ่มขึ้นเท่านั้น อนาคตไม่ไกลเราจะเริ่มเห็นบริษัทใหญ่เข้ามาร่วมวงกับเหล่า Startup เหล่านี้เยอะขึ้นเรื่อยๆ เช่น Microsoft Google และ Adobe ที่เริ่มจะนำ AI ไปใช้ในบริการของตัวเองกันบ้างแล้ว และท้ายที่สุด ใครที่มีสายป่านยาวกว่าก็จะสามารถเติบโตและอยู่รอดในยุคของ AI ต่อไปได้นั่นเอง
.
(อ่านโพสก่อนได้ที่นี่)
https://www.facebook.com/bottomlinerglobal/posts/pfbid0x4aFk9bELoGoMAfAqFMvpacMzixb1vyqbBdBMscUPydoEWAA3z722sgGV5sDCZEyl
.
BottomLiner