MacWhisper on ilmainen transkriptioohjelmisto, jota olen odottanut

Etsitkö Mac-ohjelmistoa äänitiedostojen kopioimiseksi kirjoitetuiksi tekstitiedostoiksi? On paljon maksullisia työkaluja, kuten Otter.ai ja Trint, jotka voivat maksaa oikeaa rahaa, kun aloitat niiden käytön liikaa. Mutta MacWhisper on ilmainen ratkaisu, jota Internet on odottanut. Tai ainakin se, jota olen odottanut.

OpenAI julkaisi uskomattoman tehokkaan ilmaisen ohjelman jo syyskuussa 2022, jonka avulla ihmiset, joilla oli jonkin verran tekniikkaa taitavia, voivat muuntaa ääni- ja videotiedostonsa uskomattoman tarkkoiksi transkriptioiksi. Ongelmana oli, että se ei ollut tavallinen käyttäjä, koska sinun piti olla perehtynyt Terminal-sovelluksen komentojen käyttöön.

Mutta MacWhisperin kanssa, jonka huomasi ensimmäisenä 9to5Mac, joku on vihdoin kehittänyt GUI:n eli graafisen käyttöliittymän, joka rakentuu OpenAI:n Whisperin päälle ja jättää kaikki hämmentävät tekniset asiat konepellin alle, jolloin voit vain vetää ja pudottaa äänitiedostoa ja saada transkription erittäin nopeasti. Ja MacWhisper on erittäin tarkka, koska OpenAI:n Whisper on koulutettu 680,000 tuntia äänidataa verkossa.

Yksi MacWhisperin mukavista asioista on se, että et lataa ääni- tai videotiedostoa, jonka haluat litteroida Internetiin. Tämä on tärkeää toimittajille, jotka saattavat työskennellä arkaluontoisen tarinan parissa, tai kaikille, jotka ovat vain yleensä varovaisia ​​lähettämästä henkilökohtaisia ​​tiedostojaan pilveen. Tiedosto pysyy työpöydälläsi, joten kukaan ei voi siepata ääntäsi.

Jälleen, MacWhisper on vain uusi käyttöliittymä ilmaiselle ohjelmalle, jonka OpenAI esitteli viime vuoden lopulla, mutta se todella tekee äänen transkriptiosta helppoa melkein kaikille. Koska olen käyttänyt Whisperiä ja kokenut sen erittäin hyödylliseksi sen julkaisusta lähtien. Ja jopa minä käytän nyt MacWhsiperiä, koska se varmasti nopeuttaa työnkulkuani.

Vain yhtenä esimerkkinä salausyhtiö FTX:n romahtamisesta saatujen uutisten jälkeen käytin Whisperiä litteroimaan kymmeniä tunteja vanhoja YouTube-haastatteluja yrityksen perustajan Sam Bankman-Friedin kanssa. Sieltä pystyin etsimään transkriptioita ja löytämään outoja ja mielenkiintoisia ideoita kirjoitettavaksi, kuten kun SBF sanoi kesäkuussa 2021, että blockchain olisi korjannut Enronin. SBF:n vertailu Enroniin oli outo yhteensattuma, kun otetaan huomioon kaikki, mitä nyt tiedämme FTX:n romahtamisesta. Mutta en olisi koskaan löytänyt sitä hetkeä vanhasta hämärästä haastattelusta ilman kymmeniä kopioita, joita voisin etsiä. Ja tämä prosessi, vaikkakin helpompaa kuin tuntikausien nauhojen kuunteleminen, oli silti kömpelö eikä kovin automatisoitu.

Kun olin asentanut Whisperin koneelleni, kirjoitin "whisper audiofilename.mp3 —model tiny.en" Macin Terminal-sovellukseen aina, kun halusin litteroida tiedoston. WhisperMacin avulla voin vain vetää ja pudottaa äänitiedostoni ja se tekee taikansa ilman ylimääräistä kirjoittamista.

Testasin MacWhisperiä NBC Nightly Newsin jaksolla, jonka latasin YouTubesta. Ja lukuun ottamatta muutamia virheitä, kuten sanan "tuulenjäähdytys" tulkitseminen "tuulenpyörykseksi" ja Lester Holtin kuuleminen "Lester Hold" -tekstinä, transkriptio oli erittäin tarkka. MacWhisper on ilmainen, mutta ohjelmistossa on maksullinen taso, joka voisi olla hieman tarkempi, koska se käyttää OpenAI:n intensiivisempiä harjoitusmalleja, mutta ilmainen versio toimii erinomaisesti useimmille ihmisille.

MacWhisperin avulla voit viedä litteroidun sanan muutamassa eri muodossa, mukaan lukien pelkkä teksti, CSV tai jopa tekstitystiedostomuoto, kuten SRT ja VTT.

Ja MacWhisper ei ole tarkoitettu vain englanniksi. Voit litteroida ääntä 100 eri kielellä, mikä on uskomattoman kätevää. Ainoa ominaisuus, jota MacWhisperillä ei ole ja jonka kanssa olen nauttinut päätesovelluksen Whisperin pelaamisesta, on kielen kääntäminen. Olen kääntänyt virusvideoita venäjäksi ja kiinaksi, ja Twitterin kieliä puhuvat ihmiset ovat kertoneet minulle, että käännökset ovat tarkka.

Toinen ominaisuus, jota MacWhisperillä ei ole, vaikka se ei ole myöskään saatavilla OpenAI:n Whisperistä, on kyky erottaa kaiuttimet. Jos esimerkiksi kirjoitat kahden puhujan haastattelun, ei ole selkeitä merkintöjä, jotka osoittaisivat, milloin yksi puhuja on pysähtynyt ja toinen on alkanut. Mutta epäilen, että joku rakentaa sen valmiuden lopulta. Maksulliset palvelut, kuten Trint, tekevät tämän automaattisesti, ja olisi hienoa saada lopulta ilmaiseksi, mutta saat sen, mistä maksat.

MacWhisperissä on myös ominaisuus, jolla voit muuntaa puheen tietokoneesi mikrofonista tekstiksi, mikä voi olla kätevää, jos haluat litteroida jotain lennossa.

Ihmettelin kuukausia, milloin joku viimein kehittäisi graafisen käyttöliittymän Whisperille, sillä muutamat ihmiset kokeilivat sitä, mutta eivät luoneet mitään kovin käyttäjäystävällistä. Mutta MacWhisper, jonka on kehittänyt Jordi Bruin, on ohjelmisto, jota olen odottanut. Bruin on myös kehittänyt ohjelmistoja, kuten MacGPT, jonka avulla käyttäjät voivat käyttää ChatGPT:tä valikkopalkistaan.

Voit ladata MacWhisperin ilmaiseksi, sähköpostilla rekisteröitymällä Bruinin verkkosivuilla.

Lähde: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/