Dikategori
Lihlooho
VAANI ke setšoantšo se seholo sa puo se nang le lipuo tse ngata se hlahisitsoeng ke Indian Institute of Science (IISc), Bangalore, se nang le hora tse ka bang 21,500 tsa audio e bokelitsoeng ho tloha ho baqolotsi ba litaba ba ka bang 110,000 ho pota 120 mekhahlelo liphethong tse 22 tsa India. E akaretsa lipuo le mekhahlelo e 86 e buuoang ho pota India, ho kenyelletsa lipuo tse kholo tse behiloeng le mefuta e mengata ea lehae le ea setjhaba, ka hora tse 835 tsa puo e ngotsoeng.
Setšoantšo se etselitsoe ho ts'ehetsa mefuta e fapaneng ea mesebetsi ea puo le lipuo ho kenyelletsa ho amohela puo ka boiketsetso, ho hlahisa puo ho tloha teksteneng, ho khetholla moqolotsi, ho khetholla puo, ho ntlafatsa puo, le nts'etsopele ea mohlala oa puo o amanang le mekhahlelo e meng. E lokolloa tlasa tumello ea CC BY 4.0, e etselitsoe haholo bakeng sa koetliso le ho lekanya mekhahlelo ea AI, e nang le bohlokoa bo khethehileng ho ba batlisisi le ba nts'etsopele ba sebetsang ka lipuo tsa India tse nang le lisebelisoa tse fokolang le tse sa emelang.
Motsoako le Nts'etsopele
VAANI (e bolelang "lentsoe" kapa "puo" ka lipuo tse 'maloa tsa India) e thehiloe ke Indian Institute of Science (IISc) Bangalore e le karolo ea boiteko ba ho rarolla phokotso e kholo ea lisebelisoa tsa data ea puo bakeng sa lipuo tsa India. Sebaka sa lipuo sa India se pakeng tsa tse ngata ka ho fetisisa lefatšeng, se kenyelletsang lipuo tse makholo le mekhahlelo e mengata, empa boholo ba data ea puo e teng bo shebane le lipuo tse 'maloa tse nang le lisebelisoa tse ngata. VAANI e entsoe ho eketsa ho fumaneha ha data ea koetliso bakeng sa sebaka sena sa lipuo se sa fumaneheng hantle ka ho etsa pokello e kholo ea data ea lefats'e libakeng tse fapaneng ka mokhoa le lipuo.
Data e bokelitsoe ho tloha ho batho ba 110,000 ba buang lipuo tse fapa-fapaneng ho pota 120 disitrikheng liphethong tse 22 tsa India, e bonts'ang boiteko bo ikhethang ba ho nka liphetoho tse 'nete tsa sebaka le mekhahlelo eseng ho itšetleha ka rekoto e laoloang ka studio. Dataset e akaretsa lipuo le mekhahlelo e 86, ho tloha lipuong tse kholo tse behiloeng ka nako e amanang le Hindi, Tamil, Telugu, Bengali, Kannada, le Malayalam ho ea ho mefuta e mengata ea libaka le lipuo tsa borai ho kenyelletsa Gondi, Santali, Kurukh, Wancho, le Tenyidie, har'a tse ling.
Sehlahisoa sa Dataset le Melemo e Meholo
VAANI e na le hora tse ka bang 21,500 tsa audio ka kakaretso, e etsang hore e be e 'ngoe ea mehloli e meholo ea puo e amanang le lipuo tsa India. Ho tloha ho tsena, hora tse 835 li fetolelitsoe, li fa litlhaku tse 'nete tsa tekanyo bakeng sa karolo ea pokello. Dataset e boetse e kenyelletsa likarolo tse ngata, e e etsa hore e be le ts'ebeliso ka ntle ho mesebetsi e tloaelehileng ea puo.
Melemo e meholo ea dataset e kenyelletsa:
- Ho koahela lipuo le mekhahlelo e 86, ho kenyelletsa mefuta e mengata e fokolang le lipuo tsa borai
- Mehato e tsoang ho batho ba 110,000 ba buang lipuo tse fapaneng ka mekgwa le mekhahlelo e fapaneng
- Hora tse 21,500 tsa audio ka kakaretso le hora tse 835 tsa puo e fetolelitsoeng
- Mehato e entsoeng libakeng tse 120 liphethong tse 22 tsa India
- Ho lokolloa tlasa tumello ea CC BY 4.0, e lumellang ts'ebeliso e pharaletseng ka ho fa litlhaku
- Tšepo bakeng sa liphetho tse bobebe le tse ngata
Misebetsi e Ts'ehetsoeng le Likhetho
VAANI e etselitsoe ho sebetsa e le mohloli bakeng sa mesebetsi e fapaneng ea puo le ts'ebetso ea lipuo. Baenjiniere le bahlahlobi ba ka e sebelisa bakeng sa koetliso le ho lekola mekhahlelo ea ho amohela puo ka boiketsetso (ASR), synthesis ea mongolo ho puo (TTS), ho khetholla bahlahisi, le mehlala ea ho khetholla lipuo. Dataset e boetse e tšehetsa mosebetsi oa ho ntlafatsa puo le nts'etsopele ea mehlala e meholo ea lipuo (LLMs). Bophahamo ba ho koahela lipuo bo etsa hore e be bohlokoa haholo bakeng sa ho lekola mekhahlelo e reretsoeng ho sebetsa ho pota sebaka se fapaneng sa lipuo sa India.
Ha ho nahanoa ka ho kenyelletsa lipuo le mekhahlelo e mengata e fokolang tseo ho tsona ho se nang data ea puo e ngata, VAANI e na le boleng bo khethehileng bakeng sa bahlahlobi ba shebaneng le ho aha theknoloji ea lipuo e kenyelletsang. E fa motheo bakeng sa nts'etsopele ea lisebelisoa tsa ASR le ts'ebetso ea lipuo tse tlhaho tse ka thusang communities tseo lipuo tsa tsona li 'nile tsa ba sieo ho nts'etsopele ea AI e tloaelehileng.
Boemeli ba Theknoloji ea Lipuo tsa India
Boima le phapang ea lipuo ea VAANI e etsa hore e be mpho e khahlisang lefapheng la liphuo tse ngata, haholo-holo ka har'a moelelo oa lipuo tsa South Asia. Ka ho ngola mefuta e buuoang ho tsoa ho mekhahlelo ea borai, ea mahae, le ea libaka hammoho le lipuo tse buuoang haholo, dataset e nka karolo ea heritage ea lipuo tsa India e sa tloaelehang ho bonoa mehloling ea khomphutha. Tumello ea eona e bulehileng e nolofalletsa ts'ebeliso ke mekhahlelo ea thuto, mebuso, le bahlahlobi ba indasteri ba sebetsang ho ea ka theknoloji ea puo e kenyelletsang le e emelang.