Yanayin Yau na NLP da Aikace-aikacen Sa a Inganta Ingantaccen Sadarwa a Fannin Yawon Shakuwa

Teburin Abubuwan Ciki

1. Gabatarwa
2. Hanyoyin Bincike & Zaɓin Takardu
3. Yanayin Yau na NLP & Dabarun Sa
4. Aikace-aikacen NLP a Sadarwar Yawon Shakuwa
5. Nazarin Fasaha & Muhimman Bayanai na Ciki
6. Nazarin Lamari: Sarrafa Harshen Larabci
7. Iyakokin Wannan Nazari
8. Hanyoyin Gaba & Kallon Aikace-aikace
9. Nassoshi

Kididdigar Nazari

Takardun da aka Yi Nazari

An zaɓe su ta hanyar PRISMA (2021-2023)

Mafi Girman Daidaiton Samfuri

85-95%

An ruwaito don mahimman dabarun NLP

Babban Mai Amfana

Kiwon Lafiya & Yawon Shakuwa

Sassan da aka gano don aikace-aikace

1. Gabatarwa

Sarrafa Harshe na Halitta (NLP), wani yanki ne na Fasahar Hankali (AI) da kimiyyar kwamfuta, wanda ke mai da hankali kan ba da damar kwamfutoci su fahimci, fassara, da kuma samar da harshen ɗan adam. Kamar yadda IBM (2023) ta ayyana, ya ƙunshi ilimin harshe na kwamfuta wanda aka haɗa da ƙididdiga, koyon inji, da samfuran zurfin koyo. NLP yana ba da ƙarfi ga aikace-aikace masu yawa kamar GPS mai amfani da murya, mataimakan dijital, software na murya-zuwa-rubutu, da chatbots na sabis na abokin ciniki, suna aiki cikin ainihin lokaci don haɗa hulɗar ɗan adam da kwamfuta.

Wannan takarda tana gudanar da nazari mai inganci na wallafe-wallafen da aka buga daga 2021 zuwa gaba don gano da kuma kimanta mafi yanayin yau na NLP, tare da mai da hankali musamman kan yuwuwar aikace-aikacen sa don inganta ingancin sadarwa a cikin masana'antar yawon shakuwa.

2. Hanyoyin Bincike & Zaɓin Takardu

Nazarin ya yi amfani da tsari mai tsari don gano wallafe-wallafen da suka dace. An yi amfani da kalmar bincike "sarrafa harshe na halitta" a cikin Google Scholar, tare da tacewar ranar bugawa da aka saita don 2021 da gaba. An bi hanyar Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA) don tantancewa da zaɓen takardu, kamar yadda aka kwatanta a cikin ginshiƙin da aka bayar (Hoto 1). Wannan tsari mai tsanani ya haifar da haɗa takardu 27 na ƙarshe don cikakken bincike da tattaunawa a cikin wannan nazari.

3. Yanayin Yau na NLP & Dabarun Sa

Nazarin yana zana yanayin juyin halitta na NLP, yana nuna sauyi daga samfuran da ba su da wahala zuwa gine-gine masu ƙwarewa.

3.1 Juyin Halitta na Samfura

Yanayin ya ci gaba daga ainihin samfuran NLP zuwa samfuran ayyuka da yawa, haɗa kalmomi, hanyoyin sadarwa na jijiyoyi, samfuran jeri-zuwa-jeri, da hanyoyin kulawa. Yanayin zamani na zamani ya mamaye amfani da manyan samfuran harshe da aka riga aka horar (misali, samfuran da suka dogara da ginin Transformer kamar BERT, GPT) waɗanda aka gyara su don takamaiman ayyuka na ƙasa a cikin yanayi daban-daban.

3.2 Muhimman Dabarun da aka Gano

Wallafe-wallafen da aka yi nazari sun nuna dabarun da suka shahara da yawa, ciki har da:

Nazarin Ma'ana & Samfurin Jigo
Rarraba Alama & Gano Sunayen Abubuwa (NER)
Cire Bayanai ta Atomati
Koyon Injin da ke ƙarƙashin Kulawa don ayyukan rarrabuwa
Hanyoyin da suka dogara da Ilimin Abubuwa

Wani aikace-aikace da aka ambata shi ne gano labaran ƙarya da suka shafi annobar Covid-19 daga sakonnin kafofin sada zumunta, wanda ke nuna rawar NLP wajen rage haɗarin jama'a.

3.3 Ma'aunin Aiki

A cikin nazarin kwatancen algorithms guda bakwai na NLP na Maulud et al. (2021), hanyoyin sadarwa na Ƙwaƙwalwar Ƙwaƙwalwa na Dogon Lokaci (LSTM) sun nuna mafi kyawun aiki, sannan kuma Hanyoyin Sadarwa na Jijiyoyi na Convolutional (CNN) suka biyo baya. An ruwaito daidaiton mafi yawan fasahohin ci gaba ya kasance tsakanin 85% zuwa 95%, yana nuna babban matakin dogaro don aikace-aikace na zahiri.

4. Aikace-aikacen NLP a Sadarwar Yawon Shakuwa

Takardar ta nuna cewa NLP yana da babban yuwuwar canza sadarwar yawon shakuwa, yana ba da kayan aiki don haɓaka inganci, keɓancewa, da samun dama.

4.1 Ayyukan Fassara ta Atomati

Ci gaba mai ci gaba a fasahar NLP yana ba da damar ingantattun ayyukan fassara ta atomati masu daidaito da fahimtar yanayi. Wannan na iya karya shingen harshe ga masu yawon shakuwa, yana ba da fassarar ainihin lokaci don menus, alamomi, jagorori, da tattaunawa, ta haka yana inganta ƙwararrun tafiya a wuraren ƙasashen waje sosai.

4.2 Saƙonni na Musamman & Chatbots

NLP yana sauƙaƙe ƙirƙirar chatbots masu ƙwarewa da mataimakan zamani don sashin yawon shakuwa. Waɗannan tsarin AI na iya ɗaukar tambayoyin abokin ciniki 24/7, suna ba da shawarwarin tafiya na musamman bisa ga abubuwan da mai amfani ya fi so da tunani, suna taimakawa tare da yin ajiya, kuma suna ba da hulɗa ta halitta, kamar ta ɗan adam, yana rage lokacin jira da farashin aiki.

4.3 Nazarin Tunani don Inganta Sabis

Ta hanyar amfani da nazarin tunani ga bita na kan layi, sakonnin kafofin sada zumunta, da ra'ayoyin abokin ciniki, kasuwancin yawon shakuwa na iya samun fahimtar ainihin lokaci game da gamsuwar abokin ciniki, gano abubuwan da suka fi damuwa, da kuma magance matsaloli a hankali. Wannan hanyar da ta dogara da bayanai tana ba da damar ci gaba da inganta ingancin sabis.

5. Nazarin Fasaha & Muhimman Bayanai na Ciki

Muhimmin Bayani na Ciki: Wannan nazari ba bincike ne mai ban mamaki ba amma ƙarfafa ƙarfafawa ne, yana tabbatar da juyin masana'antu gaba ɗaya daga samfuran da suka keɓance aiki zuwa AI na asali da aka riga aka horar. Ainihin bayanin ba shine "abin da" yanayin ba (samfuran da suka dogara da Transformer), amma "inda" ake amfani da shi—yana canzawa daga nunin fasaha kawai zuwa matsalolin sassa na zahiri kamar yawon shakuwa da kiwon lafiya. Takardar ta gano daidai cewa fagen fama don ƙimar NLP ba ginin samfuri ba ne, amma gyare-gyaren da ya keɓance yanki da haɗawa.

Tsarin Ma'ana: Hujjar ta bi tsarin nazari na ilimi: ayyana fagen, kafa hanyoyin bincike, gabatar da sakamakon, tattauna aikace-aikace. Ƙarfinsa shine a haɗa juyin halitta na fasaha na gaba ɗaya (Sashe na 3) zuwa takamaiman amfani (Yawon Shakuwa, Sashe na 4). Duk da haka, tsarin ya yi kuskure ta hanyar gabatar da nazarin lamarin harshen Larabci (Sashe na 6) a matsayin misali keɓaɓɓe maimakon saka shi cikin babban labarin kan ƙalubalen harsuna da yawa a cikin yawon shakuwa, yana rasa babbar damar haɗawa.

Ƙarfi & Kurakurai: Babban ƙarfin takardar shine mai da hankali kan lokaci da kuma bayyana hanyar PRISMA, yana ba da amincewa. Babban kuskuren sa shine zurfin fasaha na saman. Ambaton "LSTM ya yi mafi kyau" ba tare da tattauna dalilin ba (misali, ikonsa na sarrafa dogaro na jeri a cikin rubutu, wanda aka gudanar da daidaito kamar $c_t = f_t \odot c_{t-1} + i_t \odot \tilde{c}_t$ don sabunta yanayin tantanin halitta) dama da aka rasa. Hakazalika, ambaton daidaiton 85-95% ba shi da ma'ana ba tare da mahallin akan bayanan, aikin, da tushe ba. Wannan rashin ƙayyadaddun bayanai yana iyakance amfaninsa ga masu aikin fasaha. Bugu da ƙari, dogaro mai yawa akan Google Scholar na iya haifar da son zuciya na kwanan nan, yana iya yin watsi da takardun asali na asali amma tsofaffi daga wurare kamar ACL ko arXiv waɗanda ke da mahimmanci don fahimtar juyin halittar samfuri.

Bayanai masu Aiki: Ga shugabannin yawon shakuwa, abin da za a ɗauka a bayyane yake: fasahar NLP ta asali tana shirye; gasar za ta kasance kan aiwatarwa. Ba da fifiko ga ayyukan gwaji a cikin fassarar atomati, mai fahimtar yanayi don manyan kasuwannin ku kuma ku saka hannun jari a cikin bututun nazarin tunani don ra'ayoyin abokan cinikin ku. Ga masu bincike, takardar ta nuna wata gibi: akwai ƙarancin ingantattun nazarce-nazarce da ke auna tasirin kasuwanci kai tsaye (misali, dawowar saka hannun jari, haɓaka gamsuwar abokin ciniki) na chatbots na NLP a cikin yawon shakuwa. Takarda mai ƙima ta gaba ba za ta sake duba algorithms ba amma za ta gwada sakamakon kasuwancinsu da ƙarfi A/B.

6. Nazarin Lamari: Sarrafa Harshen Larabci

Nazarin ya taɓa rikitattun NLP na Larabci, yana nuna ƙalubalen da ya dace don sadarwar yawon shakuwa na duniya. Larabci yana wanzuwa ta hanyoyi da yawa: Larabci na gargajiya (CA, ana amfani da shi a cikin Alƙur'ani da rubutun gargajiya), Larabci na Zamani na Zamani (MSA, ana amfani da shi a cikin rubuce-rubuce na yau da kullun da kafofin watsa labarai), da yarukan Larabci daban-daban (AD, ana amfani da su a cikin sadarwar magana ta yau da kullun). Wani rikitarwa kuma shine "Arabizi," inda ake rubuta Larabci ta amfani da rubutun Latin, lambobi, da alamomin rubutu. Ingantattun aikace-aikacen NLP don yawon shakuwa a yankunan masu magana da Larabci dole ne su kewaya waɗannan bambance-bambancen don fahimtar tambayoyi da samar da amsoshi masu dacewa a cikin rajistar da ta dace, ko don fassara bayanin wurin tarihi (MSA/CA) ko fahimtar bitar gidan abinci na gida (AD/Arabizi).

7. Iyakokin Wannan Nazari

Marubutan sun yarda da iyakoki da yawa, ciki har da ƙuntatawa na hanyar nazari mai inganci, yuwuwar son zuciya a cikin tsarin zaɓen takardu, da ƙalubalen da ke tattare da rufe fagen da ke tasowa cikin sauri kamar NLP a cikin bugu mai tsayi. Iyakokin sun iyakance ga takardu daga 2021-2023, wanda, yayin da yake tabbatar da kuɗi, na iya keɓance aikin asali mai mahimmanci don cikakkiyar fahimtar yanayin da aka tattauna.

8. Hanyoyin Gaba & Kallon Aikace-aikace

Makomar NLP a cikin yawon shakuwa yana nuni zuwa ga ƙarin aikace-aikace masu shiga ciki da kuma masu himma:

Tsarin AI na Hanyoyi da Yawa: Haɗa NLP tare da hangen nesa na kwamfuta (misali, don fassara rubutu a cikin hotuna na ainihin duniya ta hanyar kyamarar wayar hannu) da gane murya don mataimakan tafiya masu sauƙi, masu fahimtar yanayi.
Keɓancewa Mai Girma: Amfani da samfuran transformer kamar T5 (Text-To-Text Transfer Transformer) don samar da tsare-tsaren tafiya na musamman, labarin labari mai ƙarfi don yawon shakuwa dangane da bayanin mai ziyara, da rubutun talla na musamman a sikeli.
Matsakaiciyar Fahimtar Tunani: Matsawa bayan ainihin tunani don gano ƙwaƙƙwaran tunani a cikin hulɗar abokin ciniki, yana ba da damar chatbots su amsa tare da tausayi da gaggawa masu dacewa.
Mai da Hankali kan Harsunan Ƙarancin Albarkatu: Faɗaɗa ingantattun kayan aikin NLP fiye da manyan harsunan duniya don biyan buƙatun kasuwannin yawon shakuwa na musamman, magance ƙalubalen da nazarin lamarin Larabci ya nuna a duniya baki ɗaya. Bincike a cikin ƙaramin harbi ko koyo mara harbi, kamar yadda aka bincika a cikin samfura kamar GPT-3, zai zama mahimmanci a nan.

Ƙwarewar ƙirƙira na NLP yana shirye don tura ayyukan yawon shakuwa gaba, yana ƙirƙirar ƙarin ƙwarewa, inganci, da gamsassun abubuwan more rayuwa ga masu tafiya a duniya.

9. Nassoshi

Alhajri, F. N. (2024). Yanayin Yau na Aikace-aikacen Sarrafa Harshe na Halitta da Aikace-aikacen Sa a Inganta Ingantaccen Sadarwa a Fannin Yawon Shakuwa. International Journal for Quality Research, 18(3), 807-816. doi:10.24874/IJQR18.03-11
IBM. (2023). Menene sarrafa harshe na halitta? An samo daga IBM Cloud Learn Hub.
Maulud, D. H., Zeebaree, S. R., Jacksi, K., Sadeeq, M. M., & Sharif, K. H. (2021). Binciken Fasaha na Jihar Art don Aikin QoS akan Algorithms na NLP. Journal of Applied Science and Technology Trends, 2(02), 80-91.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Kulawa shine duk abin da kuke buƙata. Ci gaba a cikin tsarin sarrafa bayanai na jijiyoyi, 30. (Takarda mai mahimmanci na Transformer)
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). Bert: Horar da zurfin masu canzawa na bi-directional don fahimtar harshe. arXiv preprint arXiv:1810.04805.
Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., ... & Liu, P. J. (2020). Bincika iyakokin canja wurin koyo tare da mai canzawa na rubutu-zuwa-rubutu ɗaya. Journal of Machine Learning Research, 21(140), 1-67. (Samfurin T5)