https://frosthead.com

Jedan je pisac koristio statistiku da bi otkrio tajne onoga što čini odlično pisanje

Na većini tečajeva literature na razini visokog učilišta nailazite na studente koji seciraju male dijelove književne klasike: Shakespearove solidarnosti, Joyceov tok svijesti i Hemingwayeve stacato rečenice. Bez sumnje, toliko se može pročitati o piscu, njegovom zanatu i značenju priče pomoću ove vrste uskog čitanja.

Ali Ben Blatt snažno argumentira drugi pristup. Usredotočujući se na određene rečenice i odlomke, koje on postavlja u svojoj novoj knjizi, Nabokova omiljena riječ je mav, čitatelji zanemaruju sve ostale riječi, koje u romanu prosječne dužine iznose nekoliko desetaka tisuća podataka.

Novinar i statističar stvorio je bazu podataka s nekoliko klasika i bestselera 20. stoljeća kako bi kvantitativno odgovorio na brojna zanimljiva pitanja. Njegova analiza otkrila je neke čudne obrasce koji bi u protivnom mogli proći neopaženo:

Po brojevima su najbolje početne rečenice romana kratke. Ugledni autor James Patterson prosječno bilježi 160 klišeja na 100.000 riječi (što je 115 više od ugledne Jane Austen), a Vladimir Nabokov koristio je riječ mauve 44 puta češće od prosječnog pisca u posljednja dva stoljeća.

Smithsonian.com razgovarao je s Blattom o njegovoj metodi, nekim njegovim ključnim nalazima i zašto su veliki podaci važni za proučavanje literature.

Zauzeli ste statistički pristup proučavanju svega, od mjesta gdje je Waldo do Seinfelda, fast food spojeva do pop pjesama. Možete li objasniti svoju metodu i zašto to što radite?

Ja sam novinar podataka i gledam na stvari iz pop kulture i umjetnosti. Doista volim gledati na stvari kvantitativno i nepristrano, a imaju puno informacija koje ljudi nisu prošli. Ako biste htjeli naučiti o tome kako izgleda tipična osoba iz Sjedinjenih Država, bilo bi korisno, ali ne biste samo razgovarali s jednom osobom, znali sve o njima i pretpostavili da je sve o ljudima u Sjedinjenim Državama isti. Mislim da se jedna stvar pri pisanju takve vrste gubi u tome što se možete usredotočiti na jednu rečenicu autora, posebno na satovima kreativnog pisanja, ili na jedan odlomak i izgubite širu sliku kako biste vidjeli ove opće obrasce i trendove koje pisci koriste iznova i iznova, stotine i možda tisuće puta u svom pisanju.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

Nabokova omiljena riječ je očaravajuća: što brojevi otkrivaju o klasicima, bestselerima i vlastitom pisanju

Kupiti

Dakle, zbog čega ste se okrenuli književnosti?

Moja pozadina je matematika i informatika, ali oduvijek sam volio čitati i pisati. Kako sam sve više i više pisao, postao sam vrlo zainteresiran kako različiti pisci i ljudi daju savjete za pisanje. Puno je toga imalo smisla, ali čini se da nije potpomognuto informacijama, a puno toga su sukobili jedni s drugima. Samo sam mislio da mora postojati način da se pisanim temama shvate kako su ljudi već dobro znali i razgovarali o njima i testirali ih na sjajnim autorima i popularnim autorima kako bi vidjeli je li ovaj savjet stvaran ili su to propisi koji ne daju propise. " stvarno ne mislim ništa u stvarnim knjigama i stvarnim stranicama.

Koje je prvo pitanje koje ste željeli postaviti o književnim klasicima i bestselerima?

Prvo poglavlje knjige je savjet o tome trebate li upotrebljavati samo priloge. Ovo je ujedno i prvo poglavlje koje sam napisao kronološki. Uglavnom je na savjetu Stephena Kinga da se u njegovoj knjizi O pisanju ne upotrebljavaju samo prilozi, što je za većinu pisaca knjiga o pisanju. Ali mnogi drugi pisci - Toni Morrison, Chuck Palahniuk - i bilo koji razred kreativnog pisanja savjetuje da se ne upotrebljava samo adverb jer je to nepotrebna riječ i znak da niste sažeti. Umjesto da kažete: "Brzo je otrčao", možete reći: "Sprint je."

Pa sam htio znati je li to zapravo istina? Ako je ovo tako dobar savjet, mogli biste očekivati ​​da ga sjajni autori zapravo i manje koriste. Očekivali biste da ih autori amateri koriste više nego objavljeni autori. Samo sam stilski želio znati, prvo je li Stephen King slijedio vlastiti savjet, a zatim vrijedi li i za sve ostale sjajne i cijenjene autore.

Pa, što ste pronašli?

Zapravo, postoji trend da autori poput Hemingwaya, Morrison-a i Steinbecka, njihove najbolje knjige, one koje su zadržane i na koje imaju trenutno najviše pažnje, knjige su s najmanjim brojem - prigovora. Također, ako usporedite pisanje amaterskih fantastika i pisanje putem interneta, koje nisu uređene s bestselerima i dobitnicima Pulitzerove nagrade u posljednje vrijeme, postoji razlika, gdje objavljeni autori koriste manje prigovore. Nisam toliko jednostrana da mislim da možete izvaditi adverte iz uredske knjige i ona će postati sjajna knjiga. To očito nije tako. Ali ima nešto u činjenici da pisci koji pišu na vrlo direktan način stvaraju knjige koje u cjelini žive najduže.

p13 - Prilozi.JPG

Kako ste krenuli u stvaranje baze podataka književnih djela?

Za mnoga pitanja koristio sam istih 50 autora koje sam odabrao pomalo proizvoljno. U osnovi se temeljila na autorima koji su bili na vrhu liste bestselera, autorima koji su bili na vrhu najvećih autora svih lista vremena i autorima koji su samo nekako predstavljali niz različitih žanrova i vremena i čitatelje. Na taj način možete usporediti ove autore i upoznati ih kroz cijelu knjigu.

Bilo mi je jako važno da, kad bih rekao nešto poput, „Toni Morrison ovom brzinom koristi ovu riječ“, govorio sam o svakom romanu koji je ikad napisao, a ne samo o tri koja mi se već događaju. U mojoj knjizi postoji od 50 do 100 autora na koje se govori cijelo vrijeme. Našao sam njihove bibliografije, a zatim pronašao sve njihove romane koje su do tada napisali kao cjelovit zapis. Na neki je način pomalo vođenje sportske statistike, gdje je svaka knjiga vrsta sezone, a onda se sve ove sezone ili knjige okupljaju kao karijera. Možete vidjeti kako se autori mijenjaju s vremenom i kako stvari funkcioniraju u cjelini. Jednom kada imate sve knjige, odgovor na ova pitanja koja su na neki način vrlo zastrašujući vrlo je jednostavan.

I kako ste obradili sav taj tekst?

Postoji programski jezik koji se zove Python, a unutar njega nalazi se skup alata koji se zove Priručnik za prirodni jezik, često skraćeno NLTK. Alati koji su u njega uključeni slobodno su dostupni svima. Paket možete preuzeti putem interneta i koristiti ga na Python-u ili drugim jezicima. Osobito ne možete dobiti mnoga pitanja o pisanju, ali možete reći koliko se puta ova riječ pojavljuje u tekstu? Može proći i prepoznati gdje se rečenice završavaju i gdje počinju rečenice, te dijelove govora - pridjev naspram glagola i glagola. Nakon što imate te alate, možete dobiti podatke.

Koju ste statistiku ručno sastavili? Što je bilo najviše mučno?

Postoji jedan odjeljak u kojem pogledam uvodne rečenice. Elmore Leonard, koji je bio vrlo uspješan romanopisac, rekao je: "Nikad ne otvarajte knjigu s vremenom." Ovo je također savjet koji se nalazi u mnogim vodičima za pisanje. Tako sam prošao stotine autora kako bih vidio koliko često otvaraju svoju knjigu o vremenu. Na primjer, Danielle Steel, vjerujem da se 45 posto njenih prvih rečenica u knjigama odnosi na vrijeme. Mnogo puta su stvari poput "Bio je to veličanstven dan" ili "Vani je bilo sunčano i sunčano". Za to, nije bilo načina da se to automatski učini, a da ne bude greške, pa bih jednostavno prošao kroz sve datoteke knjiga i označio je li uključeno vrijeme. Možete reći da je bilo naporno, jer je bilo prikupljeno puno podataka, ali bilo je zabavno proći i pročitati stotine uvodnih rečenica odjednom. Postoje i drugi obrasci koji se očito pojavljuju kod autora tijekom vremena.

P207 --- weather.jpg

Kao što kažete, dosadan je nekima, zabava za druge. Neki možda misle da je ovaj analitički pristup dosadan, ali vi tvrdite da može biti „zabavan“ i „često potpuno smiješan“. Koji je bio vaš najsmješniji nalaz?

Naslov knjige, Nabokova omiljena riječ je mav, govori o tome kako je, po brojevima, riječ koju koristi najvećom brzinom u usporedbi s engleskim glavno. To na kraju ima puno smisla ako pogledate njegovu pozadinu, jer je imao sinesteziju. U svojoj autobiografiji govorio je o tome kako će mu mozak automatski dočarati boje kad bi čuo različita slova i zvukove.

Ponovio sam taj eksperiment sa još 100 autora da vidim koja im je najdraža riječ. Kao rezultat, dobivate tri riječi koje su reprezentativne za njihovo pisanje riječima koje najviše koriste. Uljudnost, maštovitost i neopreznost. To je Jane Austen. Mislim da ako ste vidjeli te riječi, Jane Austen možda bi bila jedno od vaših prvih nagađanja. A onda imate autora poput Johna Updikea, koji je malo mrzovoljniji i stvaran i drugačijeg vremena. Njegove omiljene riječi su uokvirene, pritajene i sjebane. Mislim da je gledanje ličnosti kroz koju se bazira na tim jednostavnim matematičkim pitanjima vrlo zanimljivo. Ako imate omiljenog autora, prolazak kroz njega nekako otkrije nešto o njihovoj osobnosti koje možda prije niste primijetili.

Ray Bradbury je napisao da mu je najdraža riječ cimet. Po brojkama, on to puno koristi. Njegovo objašnjenje zašto voli cimet bilo je to što ga je podsjećalo na smočnicu njegove bake. Pa sam prošao i našao druge začinjene riječi i mirisne riječi koje se mogu povezati s bakinom smočnicom, a Ray Bradbury većinu tih riječi koristi vrlo velikom brzinom. Na neki način možete dobiti ovaj čudni, freudovski pogled na nešto o autorovim djetinjstvima. Da vam Ray Bradbury to nije rekao, možda biste to još mogli shvatiti.

Usporedili ste američke i britanske pisce, potvrđujući stereotip da su Amerikanci glasni. Možete li objasniti ovo?

Ovaj se zapravo izvorno temeljio na studiji koju je napravio student poslijediplomskog studija na Stanfordu. Identificirao je riječi koje služe za opisivanje dijaloga u knjigama i opisao ih kao glasne, neutralne ili tihe. "Šaputanje" i "mrmljanje" bili bi tihi. Neutralno bi bilo "rekao je" ili "ona je rekla", a glasno bi bilo "uzviknuo" ili "vikao". Prošao sam kroz 50 autora koje sam pogledao, kao i velike uzorke navijačke fantastike i otkrio da nisu ludom maržom, ali smislenom maržom, da Amerikanci imaju veći omjer glasnih i tihih riječi. Postoji nekoliko objašnjenja. Može biti da Amerikanci tako razgovaraju cijeli život, tako da ih pisci opisuju kako često razgovaraju. Također možete to vidjeti kao američke pisce koji imaju prednost prema akcijskim, trilerima, pričama visokog tempa u odnosu na suptilnije. Amerikanci su doista glasniji po brojkama.

Blatt_author photo_Credit Sierra Katow.JPG Ben Blatt, autor Nabokove najdraže riječi je Mauve (Sierra Katow)

Zašto mislite da je primjena matematike u pisanju dobar način za proučavanje literature?

Definitivno se ne zalažem za to da bi ovo trebao biti prvi način na koji ćete proučavati književnost ako pokušavate poboljšati svoje pisanje. Ali čak je i roman umjerene duljine vjerojatno 50 000 riječi, a to je 50 000 podataka. Jednostavno nećete moći odjednom to sve napuniti, a pojavit će se pitanja na koja jednostavno ne možete sami odgovoriti na čitanje. Dobro je vidjeti veću sliku. Ako sjednete i proučite jedan odlomak, vi na predavaču kreativnog pisanja razgovarate sa svojim profesorom, ako postoji set način na koji ćete to gledati, to ćete jednostavno vidjeti kroz sve. Ali s podacima vas takva vrsta oslobađa i možete odgovoriti na neka pitanja bez ovih pristranosti i doista dobiti neke nove informacije.

Spomenuli ste kako ste razmišljali o Roaldu Dahlu "Veliki gramatičar."

Postoji sjajna priča o Roaldu Dahlu gdje inženjer u osnovi smišlja način da napiše priču. U ovom scenariju sudbonosnog dana, netko može samo dati stroj zaplet i to će ispljunuti konačni roman. Tamo je insinuacija da stvaraju tako romantične i temeljne romane. Protagonist u toj priči odluči se ne pridružiti se radu stroja i bori se protiv njega stvaranjem vlastitog pisanja i umjetnosti.

Definitivno mislim da će ova knjiga, ako pišete, odgovoriti na mnoga pitanja za vas i definitivno će promijeniti način razmišljanja o nekim stvarima, ali u konačnici zaista nema zamjene za ideje koje ljude tjeraju na razmišljanje i prizore koji čine ljude strah ili povezivanje s likovima. U ovoj se knjizi gleda na zanat pisanja, a ne nužno i na stvaranje priče za pamćenje. Ova knjiga ne pokušava stvoriti savršen roman, i mislim da nismo toliko bliski tome kao što se neki ljudi mogu bojati.

Jedan je pisac koristio statistiku da bi otkrio tajne onoga što čini odlično pisanje