Transformer Apache 2.0 Yes
Português

Tsenyo

text

Tshwaelo

text

Ditheme

generative ainlpresearch

Tucano ke lelapa la mehlala ya puo ya transformer e e nang le “open-weights” e e tlhabolotsweng kwa Brazil mme e rutilwe fela mo diteng tsa puo ya Seportugetshe. Mehlala e ne ya rutiwa pele mo GigaVerbo, e leng setlhopha sa datha se se nang le dikarolo tsa puo tsa Seportugetshe tse di ka nnang 200 bilione tse di tlositsweng tse di tshwanang, mme e a bonwa ka dikarolo di le nne go tloga mo go dimilione di le 160 go fitlha mo go dimilione di le 2.4 tsa dipharamente.

Dikgatiso tse di rulagantsweng ka go tlhabolola di akaretsa mefuta e e latelang ditaelo le e e tlhomamisitsweng ka dikgetho, mme ditlhamo tse di amanang le tsa bontsi jwa mefuta ya ditiro tsa matlho le tsone di ne tsa gololwa fa tlase ga leina la ViTucano. Tucano e ikaelelwa mo go bafuputsi le ba ba tlhabololang ba ba dirang mo ditiro tsa go sekaseka puo ka Seportugetshe, e leng puo e e neng e sa emelwa thata mo tlhabololong ya mehlala e megolo ya puo mo lobakeng lo lo fetileng.

Morero o tlhalositswe mo pampiring ya 2025 e e gatisitsweng mo makasineng wa Patterns, mme o golotswe fa tlase ga laesense ya Apache 2.0, ka dipharamente le khoutu di lebeletswe phatlalatsa mo GitHub. Letoto la mehlala jaanong le tsentswe mo polokelong.

Kaelo le Tlhabololo

Tucano e tlhabolotswe kwa Brazil e le maiteko a ikgethileng a go rarabolola bothata jwa go tlhoka dikaelo tse dikgolo tsa puo tse di rutilweng ka tlhamalalo mo ditemeng tsa Seportugete. Le fa dikaelo di le dintsi tse di tumileng tsa puo di rutiwa bogolo ka dikarolo tsa Seesemane, Seportugete—se buiwang ke batho ba ba fetang dimilione di le 250 mo Brazil, Portugal, le dinageng tse dingwe—esale se sa newa tlhokomelo e ntsi mo dipatlisisong tsa motheo tsa mekgwa ya mehlala. Morero wa Tucano o ne wa ikaeletse go tswala lekhalanyana leno ka go aga mekgwa ya transformer go tloga kwa tlase ka dataset e kgolo e e boleng jo bo kwa godimo ya Seportugete.

Mehlala e ne ya rutiwa pele mo GigaVerbo, e leng setlhopha sa dikarolo tsa Seportugete tse di ka nnang dimilione di le 200 tse di tlositsweng boiphetetso, se rulagantswe go tshegetsa go ithuta ga puo ka botswerere mo maemong a bogolo. Morero o tlhalositswe mo pampiring Tucano: Advancing Neural Text Generation for Portuguese, e e gatisitsweng mo makasineng Patterns ka 2025, mme dimaele tsotlhe le khoutu ya go rutiwa di a bonwa mo phatlalatsong mo GitHub ka fa tlase ga laesense ya Apache 2.0.

Diphapano tsa Mehlala le Dikitsiso tse di Rutilweng ka Tlhomamo

Lelapa la Tucano le akaretsa bogolo jwa mehlala ya motheo e le mene, e e letlang baitsesaakanyi le ba ba tlhabollang go tlhopha mohlala o o tshwanetseng bokgoni jwa bona jwa go bereka le ditlhokego tsa tiro:

  • Tucano-160m – dipharologanyo di le 160 milione
  • Tucano-630m – dipharologanyo di le 630 milione
  • Tucano-1b1 – e ka nnang dipharologanyo di le 1.1 bilione
  • Tucano-2b4 – e ka nnang dipharologanyo di le 2.4 bilione

Kwa ntle ga mehlala ya motheo e e rutilweng pele, morero o tlhagisitse dikarolo di le mmalwa tse di tsentsweng mo go rutiweng ka tlhomamo. Tucano-SFT le Tucano-DPO di emela mefuta ya go rutiwa ka tlhokomelo (supervised fine-tuning) le ya go tlhomamisa dikgethollo ka tlhamalalo (direct preference optimization) ka go latelana, fa Tucano-2b4-Instruct e le mofuta wa go latela ditaelo wa mohlala o mogolo wa motheo. Dikitsiso tse di rutilweng ka tlhomamo tseno di oketsa mosola wa mehlala ya motheo mo go diriseng mo dipuisanong le mo ditirong tse di lebegang mo maikaelelong.

Mehlala e e amanang ya multimodal, ViTucano-1b5-v1 le ViTucano-2b8-v1, le yone e ne ya gololwa ka leina la ViTucano, e bontsha tiro e e latelang e e akaretsang bokgoni jwa go tlhaloganya ditshwantsho gaufi le ditemana tsa Seportugete.

Dikitsiso le Badirisi ba ba Ikanyegang

Tucano e lebisitswe bogolo mo baitsesaakanyi le ba ba tlhabollang ba ba dirang mo ditiro tsa go sekaseka puo ya tlhago ka Seportugete. Dikitsiso tse di ka dirisiwang di akaretsa go tlhagisa ditemana, ditekanyetso tsa go ithuta puo, go rutiwa gape go ya ka lefelo le le rileng la ditiriso tsa Seportugete, le go nna motheo wa dipatlisiso mo go ithuteng maitsholo a mehlala mo maemo a puo e e nang le dikhumo tse di kwa tlase. Go nna le bogolo jwa mehlala e le mmalwa go tshegetsa maemo a a farologaneng a go e tsenya mo tirisong, go tswa mo dipatlisisong tsa kwa sekolong ka didirisiwa tse di lekanyeditsweng go ya mo dipatlisisong tse di tlhagisang tiro e e tlhokang dikhumo tse dintsi.

Ka gonne mehlala e golotswe ka fa tlase ga laesense e e letlelang ya Apache 2.0 ka dimaele tse di bulegileng, e ka dirisiwa ka bolokologi, ya fetolwa, mme ya abiwa gape, e dira gore e nne e bonala mo setšhabeng se se pharaletseng, go akaretsa le ba ba se nang le phitlhelelo mo di-API tsa mehlala tsa beng.

Maitemogelo a Gompieno

Leloko la mehlala ya Tucano jaanong le tsentswe mo polokelong, go raya gore tlhabololo e e tswelelang e feletse. Dimaele, khoutu, le ditokomane tse di amanang le tsona di santse di bonwa mo phatlalatsong ka fa tlase ga polokelo ya GitHub ya morero, e le gore di ka dirisiwa gape mo go tlhaloseng le mo go tswelelang ga dipatlisiso ke setšhaba sa dipatlisiso. Go gatisiwa ga dipoelo mo Patterns ka 2025 go naya rekoto e e tlhatlhobilweng ke balekane ya mokgwa, datha ya go rutiwa, le dipoelo tsa tekanyetso tse di amanang le morero, go tshegetsa go ka dirisiwa gape le go tswelela pele ka dithuto.

Pegelo