Bibliša: Aligned Collection Search Tool

[ Log In ] [ Register ]

 [About]



En/De/Fr/It- (first 9 out of 16 sentences) [pdf] Srpski - (prvih 9 od 16 rečenica) [pdf]
n1Никола Јанковићn1Nikola Janković
n2Филолошки факултет, Универзитет у Београдуn2Filološki fakultet, Univerzitet u Beogradu
n3nikolajankovickv@gmail.comn3nikolajankovickv@gmail.com
n4Јована Иванишn4Jovana Ivaniš
n5Институт за српски језик САНУn5Institut za srpski jezik SANU
n6jovana.ivanis@gmail.comn6jovana.ivanis@gmail.com
n7USAGE OF THE WHISPER LARGE V3 SR MODEL FOR THE TRANSCRIPTION OF SERBIAN SPOKEN LANGUAGE IN PYTHON PROGRAMMING LANGUAGE ON THE GOOGLE COLAB PLATFORMn7UPOTREBA MODELA WHISPER LARGE V3 SR ZA TRANSKRIPCIJU GOVORA NA SRPSKOM JEZIKU U PROGRAMSKOM JEZIKU PAJTON NA PLATFORMI GUGL KOLAB
n8This paper presents a Python script on the Google Colab platform, which uses a fine-tuned model for the transcription of speech in Serbian, Whisper Large v3 Sr (https://huggingface.co/Sagicc/whisper-large-v3-sr-cmb), which enables free, high-quality and simple transcription of Serbian speech into text.n8U ovom radu predstavljen je skript u programskom jeziku Pajton (engl. Python) na platformi Gugl kolab (engl. Google Colab) koji koristi fino podešeni model za transkripciju govora na srpskom jeziku Whisper Large v3 Sr (https://huggingface.co/Sagicc/whisper-large-v3-sr-cmb), čime se omogućava besplatno, kvalitetno i jednostavno transkribovanje govora na srpskom jeziku u tekst.
n9 The motivation for creating this script came from the lack of available tools which would allow researchers to use this model in a straightforward way, without the need for advanced technical knowledge and significant computing resources.n9 Motivacija za kreiranje ovog skripta proistekla je iz nedostatka dostupnih alata koji istraživačima pružaju jednostavno korišćenje ovog modela bez potrebe za naprednim tehničkim znanjima i značajnim računarskim resursima.