¼¿ï´ëÇб³ °ø°ú´ëÇÐ(ÇÐÀå È«À¯¼®)Àº ÄÄÇ»ÅÍ°øÇкΠ±èÇö¿ì ¹Ú»ç¿Í ±è°ÇÈñ ±³¼ö°¡ ¹Ì±¹ ½Ã¾ÖƲ ¾Ù·± ÀΰøÁö´É ¿¬±¸¼Ò(Allen Institute for AI, AI2) ¹× ¿ö½ÌÅÏ ´ëÇб³(University of Washington)ÀÇ ÃÖ¿¹Áø ±³¼ö µî°ú ÇÔ²² ÁøÇàÇÑ ¿¬±¸°¡ ±¹Á¦ ÃÖ¿ì¼ö ÀÚ¿¬¾îó¸® Çмú´ëȸ ¡®EMNLP 2023¡¯¿¡¼ ¡®Outstanding Paper Award¡¯¸¦ ¼ö»óÇß´Ù°í ¹àÇû´Ù.
±¹³» ´ëÇÐ ¿¬±¸ÁøÀÌ EMNLP¿¡¼ ¼ö»óÀ» ÇÑ °ÍÀº À̹øÀÌ ÃÖÃÊ´Ù.
±âÁ¸ ÀΰøÁö´É(AI) ´ëÈ ºÐ¾ß´Â °íÁúÀûÀ¸·Î µ¥ÀÌÅÍ ºÎÁ· ¹®Á¦¿¡ ½Ã´Þ·Á¿Ô´Ù. Àϻ󿡼 ÀÌ·ïÁö´Â ´ëȵéÀº µ¥ÀÌÅÍ·Î ±â·ÏµÇÁö ¾Ê´Â °æ¿ì°¡ ´ëºÎºÐÀ̱⠶§¹®ÀÌ´Ù. ¹®ÀÚ ¸Þ¼¼Áö³ª À̸ÞÀÏ °°Àº ÇüÅ·Π´ëÈ°¡ ±â·ÏµÇ´õ¶óµµ ¿©·¯ ¹ýÀû Á¦¾àµéÀÌ Á¸ÀçÇϱ⠶§¹®¿¡ À̸¦ ¿¬±¸¿¡ È°¿ëÇϱ⿡´Â ¾î·Á¿ü´Ù.
ÀÌÀÇ ´ë¾ÈÀ¸·Î ±×µ¿¾È Å©¶ó¿ìµå ¼Ò½ÌÀ» ÅëÇØ ´ëÈ µ¥ÀÌÅͼÂÀ» Á¦ÀÛÇØ¿ÔÁö¸¸ ºñ¿ëµµ ¸¹ÀÌ µé°í, ¸¸µé ¼ö ÀÖ´Â µ¥ÀÌÅͼ ũ±âµµ ÀÛÀº ¹®Á¦Á¡ÀÌ ÀÖ´Ù. ±× °á°ú, ±âÁ¸ ´ëÈ °ü·Ã ¿¬±¸µéÀº ¸ðµÎ ¼Ò¼öÀÇ ÀÛÀº µ¥ÀÌÅͼ À§¿¡¼ ÀÌ·ïÁ® ¹ü¿ë¼º¿¡ Å« Á¦¾àÀÌ ÀÖ¾ú´Ù.
¼ö»ó ³í¹®ÀÎ ¡®»çȸ »ó½Ä ¸Æ¶ôÈ ±â¹ýÀ» ÅëÇÑ ¹é¸¸ ´ÜÀ§ÀÇ ´ëÈ Áõ·ù(SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization)¡¯´Â À̸¦ ÇØ°áÇϱâ À§ÇØ °Å´ë ¾ð¾î¸ðµ¨(large language model, LLM)°ú ±âÈ£ ±â¹Ý »ó½Ä ±×·¡ÇÁ(symbolic commonsense knowledge graph)¸¦ ÇÔ²² »ç¿ëÇØ µ¥ÀÌÅͼÂÀ» È¿À²ÀûÀ¸·Î ÀÚµ¿ ±¸ÃàÇÏ´Â ¹æ¹ý·ÐÀÎ CO_3 Áõ·ù ÇÁ·¹ÀÓ¿öÅ©(distillation framework)¸¦ Á¦½ÃÇß´Ù.
±âÁ¸¿¡ Å©¶ó¿ìµå ¼Ò½Ì È°¿ë ½Ã¿¡´Â ´ëÈ Çϳª´ç ±æ°Ô´Â ¸î ºÐÀÌ °É¸®´ø ÀÛ¾÷À» 6ÃÊ ³»¿Ü·Î ´ÜÃà½ÃŲ´Ù. ¿¬±¸ÆÀÀº À̸¦ ÅëÇØ ¼¼°è ÃÖÃÊ·Î 150¸¸ ±Ô¸ðÀÇ ¼¼°è ÃÖ´ë °íÇ°Áú ÀÏ»ó ´ëÈ µ¥ÀÌÅͼÂÀÎ ¡®SODA¡¯¸¦ ¹«·á·Î °ø°³Çߴµ¥, ÀÌ´Â ±âÁ¸ µ¥ÀÌÅͼ ´ëºñ 100¹è Å« ±Ô¸ð´Ù.
ÀÌ ¹Û¿¡µµ ´ëÈÀÇ ÀÚ¿¬½º·¯¿ò, ÀÏ°ü¼º, ±¸Ã¼¼º µî Ç°Áú ¶ÇÇÑ ±âÁ¸ Å©¶ó¿ìµå ¼Ò½Ì ±â¹Ý ´ëÈ µ¥ÀÌÅͼ¿¡ ºñÇØ 2¹è ÀÌ»ó ¶Ù¾î³ °ÍÀ¸·Î ³ªÅ¸³µ´Ù. ±× °á°ú, SODA¿¡ ÇнÀ½ÃŲ 꺿 ¡®COSMO¡¯´Â ÆĶó¹ÌÅÍ ¼ö°¡ 30¾ï °³·Î ÀÛÀº Å©±âÀÓ¿¡µµ ºÒ±¸ÇÏ°í ±âÁ¸ Å« 꺿µé(ÆĶó¹ÌÅÍ ¼ö 70¾ï)º¸´Ù ´ëÈ ¸Æ¶ô¿¡ ´õ ÀûÇÕÇÏ°í ÀÚ¿¬½º·¯¿î ´äº¯ÀÌ °¡´ÉÇÏ´Ù.
À̹ø ¿¬±¸´Â ´ëÈ µ¥ÀÌÅͼ ºÎÁ· ¹®Á¦¸¦ ÇØ°áÇÏ°í, ´©±¸³ª °£ÆíÇÏ°Ô ¼¼°è ÃÖ´ë ±Ô¸ðÀÇ °íÇ°Áú ´ëÈ µ¥ÀÌÅͼÂÀ» ±¸ÃàÇÒ ¼ö ÀÖ´Â ¹æ¹ý·ÐÀ» Á¦½ÃÇß´Ù´Â µ¥¿¡ ÀÇÀÇ°¡ ÀÖ´Ù. ÀÌ ¹æ¹ý·ÐÀ¸·Î ź»ýÇÑ µ¥ÀÌÅͼ SODA´Â ´Ù¾çÇÑ ´ëÈ ¿¬±¸¿¡ ±â¹Ý ÀÚ·á·Î ¾²ÀÏ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëµÇ¸ç, ÇØ´ç ÄÚµå¿Í SODA µ¥ÀÌÅͼÂ, COSMO ¸ðµ¨Àº ¸ðµÎ ¿ÀǼҽº·Î °ø°³µÅ ÀÖ´Ù.
ÇØ´ç ³í¹®Àº ±èÇö¿ì ¹Ú»ç°¡ ¼¿ï´ë ¹Ú»ç°úÁ¤ Áß ¹Ì±¹ ½Ã¾ÖƲÀÇ ¾Ù·± ÀΰøÁö´É ¿¬±¸¼Ò(Allen Institute for AI, AI2)¿¡¼ ÀÎÅÏÀ» ¼öÇàÇÏ¸ç ¿ö½ÌÅÏ ´ëÇб³(University of Washington), Ä«³×±â¸á·Ð ´ëÇб³(Carnegie Mellon University), ¼´ø Ķ¸®Æ÷´Ï¾Æ ´ëÇб³(University of Southern California), ±×¸®°í ÇÇÃ÷¹ö±× ´ëÇб³(University of Pittsburgh)°¡ ÇÔ²²ÇÏ´Â ±¹Á¦ °øµ¿Çù·Â ¿¬±¸¸¦ À̲ö °á°ú¸ç, ±èÇö¿ì ¹Ú»ç´Â Á¹¾÷ ÈÄ AI2¿¡¼ ¹Ú»çÈÄ ¿¬±¸¿øÀ¸·Î Ãë¾÷ÇØ ÈÄ¼Ó ¿¬±¸¸¦ À̾´Â ÁßÀÌ´Ù.
±èÇö¿ì ¹Ú»ç¿Í ±è°ÇÈñ ±³¼ö´Â Á¤º¸Åë½Å±âȹÆò°¡¿ø(IITP)ÀÇ ¿¬±¸ºñ¸¦ Áö¿ø¹Þ¾Ò´Ù.(No.2019-0-01082, No.2022-0-00156)
¡Ø ³í¹® ¸µÅ©: https://aclanthology.org/2023.emnlp-main.799
¡Ø ÄÚµå ¸µÅ©: https://hyunw.kim/sodaverse
¾ð·Ð¿¬¶ôó: ¼¿ï´ëÇб³ °ø°ú´ëÇÐ ÄÄÇ»ÅÍ°øÇкΠ±èÇö¿ì ¹Ú»ç 02-880-7289
ÀÌ ´º½º´Â ±â¾÷¡¤±â°ü¡¤´Üü°¡ ´º½º¿ÍÀ̾ ÅëÇØ ¹èÆ÷ÇÑ º¸µµÀÚ·áÀÔ´Ï´Ù.