Svatá válka programátorů má vítěze: mezery vydělají více než tabulátory

Na funkci aplikace nemají neviditelné znaky žádný vliv, ale mezi programátory se už dlouho řeší, zda je lepší používat k odsazení mezerník, nebo tabulátor. Výsledky nového průzkumu StackOverflow znovu rozdmýchaly plameny této programátorské svaté žabomyší války.
„Svatá programátorská válka“ mezi tabulátory a mezerníky

„Svatá programátorská válka“ mezi tabulátory a mezerníky | foto: Pavel Kasík - Technet.cz

„Čím odsazuješ? Mezerou, nebo tabulátorem?“
„Je to jedno. Jak to projde kompilátorem, nezáleží na tom.“
„Technicky vzato nezáleží, ale...“

Jen málokterý profesní spor působí zvenčí tak nesmyslně jako vleklá programátorská válka mezi mezerníky a tabulátory. Do povědomí veřejnosti se dostala především díky roli v seriálu Silicon Valley (HBO). Ještě, než se dostaneme k výsledkům velkého průzkumu mezi programátory, se tedy v rychlosti podívejme, v čem jádro této žabomyší „svaté války“ spočívá.

Ukázka zdrojového kódu bez odsazení (github/Bitcoin)

Vše se točí kolem toho, jakým způsobem programátoři píší tzv. „zdrojový kód“, tedy textový soubor obsahující příkazy pro daný skript nebo aplikaci. Zdrojový kód se poté prožene kompilátorem (případně interpretem) daného programovacího jazyka. Kompilátor přitom obvykle ignoruje prázdná místa - mezery, tabulátory, komentáře. Tato prázdná místa tedy slouží prakticky výhradně k tomu, aby se programátoři snáze orientovali v kódu. Odsazení zleva (tzv. indentation) slouží například k vizuálnímu zvýraznění vnořených funkcí nebo cyklů.

Odsazení pomocí mezer (dodatečně doplněny zelené šipky)
Ukázka kódu s odsazením tabulátory (doplnili jsme zelené šipky)

Odsazení pomocí mezer a tabulátorů (dodatečně doplněny zelené šipky)

Zastánci tabulátorů se ohánějí především tím, že je to rychlejší a jednodušší, není potřeba odpočítávat mezery. Programátoři, kteří odsazují mezerníkem, zase připomínají, že mezera se všem zobrazí stejně, bez ohledu na editor.

Tak, a teď k tomu novému průzkumu, který - zjevně zcela neplánovaně - přinesl do této klasické války novou munici.

Používáte mezerník? Dostáváte více peněz

„Nikdy jsem si nemyslel, že volba mezer, nebo tabulátorů je nějak zvlášť důležitá. Ale nyní zveřejňujeme data týkající se našeho výzkumu programátorů a ukázalo se, že na tom zřejmě záleží více, než jsem čekal,“ uvedl na blogu programátorské komunity StackOverflow datový analytik David Robinson.

Na základě analýzy více než 12 tisíc respondentů, kteří odpověděli na otázku, zda preferují mezerník, či tabulátor, a také na otázku, kolik berou peněz, sestavil Robinson několik grafů. Ty celkem jasně ukazují, že zastánci mezer mají vyšší měsíční výplatu. A to překvapivě bez ohledu na to, jak dlouho programují, v jakém jazyce programují nebo v jakém oboru programují.

Programátoři, kteří k odsazení zleva používají mezery (červená linka), vydělávají významně více, než programátoři, kteří používají tabulátory (zelená) nebo obojí (modrá). Tento rozdíl zůstává zachovaný bez ohledu na roky zkušeností v oboru

Kdykoli se v datech objeví korelace, kterou je těžké vysvětlit, vyplatí se hledat, jakým dalším atributem by mohla být způsobena (tzv. confounding factor, tedy třetí závislá proměnná). Například kdyby bylo používání tabulátorů rozšířenější v zemích, kde programátoři vydělávají méně (všechny mzdy byly přepočítány na dolary), nebo kde jsou platy obecně nižší (např. Indie), snadno by se tak dal rozdíl vysvětlit. Robinson však ukázal, že žádná z proměnných, které v průzkumu měřil, nedokáže tento rozdíl ve mzdách „mezerovníků“ a „tabulátorníků“ vysvětlit.

Rozdíly mezi programátory, kteří preferují mezery, tabulátory nebo nemají preferenci, je víceméně zachován napříč různými zeměmi.

Rozdíl mezi platem vývojářů používajících mezery a těmi, kteří preferují tabulátory, zůstal zachován i u různých programovacích jazyků nebo různých oborů

„Tento jev zůstal patrný u jakékoli podskupiny vývojářů, a to dokonce i když jsem výběr omezil jen na konkrétní zemi nebo konkrétní obor či délku praxe,“ popisuje Robinson.

Na základě regresní analýzy odhadl i velikost tohoto „mezerníkového“ vlivu na mzdu: používání mezerníku indikuje v průměru o 8,6 % vyšší plat. „Řečeno jinak, používání mezerníku je pro programátora asi taková výhoda, jako kdyby měl navíc 2,4 roku zkušeností v oboru.“

Několik programátorů, které jsme oslovili, se k tomuto závěru stavěli pobaveně a skepticky. Skepsi a bouřlivou debatu si analýza vysloužila i na odborných fórech. Svůj účel tedy článek StackOverflow zjevně splnil - mluví se o něm všude.

Ostatně otázka „Tabs or spaces?“ byla zřejmě položena napůl v žertu, jako odpočinek uprostřed průzkumu. Nebylo tak třeba definováno, zda se tím myslí „kterou klávesu mačkáte“ nebo „jaký znak vkládáte“ (některé editory vkládají po stisku tabulátoru přednastavený počet mezer).

Kontroverzní výsledek bez jasného vysvětlení

Hned po publikaci analýzy se programátoři z celého světa ozvali a debata pokračovala na Twitteru i Hacker News několik dnů. Další analytici přispěchali s vylepšenými grafy, například do grafů doplnili intervaly nejistoty.

15.června 2017 v 18:15, příspěvek archivován: 20.června 2017 v 16:05

Salaries of tab-users vs. space-users in @drob 's report are too close to call, so I added bootstrapped conf intervals. Still holds, nice. https://t.co/wbHwa4n6Z9

Jednou z nejlepších hypotéz, které by vysvětlily tento rozdíl, byla ta od Richarda Gaywooda: „Mám podezření, že menší množství velkých firem, které vyplácejí velké mzdy, vyžaduje od svých programátorů používání mezer, což ovlivnilo průměrné mzdy v dotazníku.“ Ovšem Robinson ukázal, že rozdíl zůstal zachován, i když vzal v potaz velikost firmy, pro kterou respondent pracuje.

16.června 2017 v 01:23, příspěvek archivován: 20.června 2017 v 16:12

If a few large, space-mandating companies skewed the results, the tabs/space difference would be larger in big companies. But it isn't: https://t.co/5kJV1NpjPx

Sám Robinson nicméně připomíná klasickou poučku, že korelace není kauzalita. „Nikdy si nemůžeme být jistí, že jsme vzali v úvahu všechny závislé proměnné, které by mohly tento rozdíl vysvětlit,“ uvedl Robinson, který proto vyzývá další datové analytiky, aby si stáhli surová data průzkumu a pomohli jeho analýzu reprodukovat.

Češi v průzkumu

Pro zajímavost: průzkumu se zúčastnilo i 411 Čechů. Rozdělení mezi nimi bylo vyrovnané: 31 % preferovalo tabulátory, 30 % mezery, 17 % obojí a zbývající na otázku neodpověděli. Jde o příliš malou podskupinu na to, abychom z ní vyvozovali další závěry.

Podobné průzkumy, které nejsou zaměřeny na konkrétní otázku, ale namísto toho sbírají velké množství rozmanitých dat, nejsou ideální k hledání odpovědí na konkrétní otázku. Mohou ale naznačit oblast, která si zaslouží další výzkum. V redakci jsme si data také stáhli a spekulovali jsme, že rozdíl je možná částečně způsoben tím, že mezerníky používají k odsazování programátoři, kteří jsou zvyklí pracovat v rozmanitém týmu (mezery se zobrazí všem stejně, u tabulátorů to jisté není). To by mohla být vlastnost, která je užitečná pro spolupráci, a schopnost spolupráce by mohla být lépe finančně ohodnocena.

Může za vyšší mzdy open-source?

Letošní průzkum StackOverflow vyprovokoval k analýze „těžko uvěřitelných“ dat řadu dalších analytiků, mezi nimi i Evelinu Gabasovou. Ta replikovala Robinsonovu regresní analýzu a dále na ni navázala: „Použila jsem dva ANOVA regresní modely, abych zjistila, jak dobře dokáží předpovědět výši platu.“

  • Jeden z modelů bral v potaz všechny možné proměnné: zemi původu, roky zkušeností, používání tabů nebo mezerníků, programovací jazyk, dosaženou úroveň vzdělání, zda přispívají do open-source projektů, zda programují pro zábavu či profesionálně, velikost firmy, pro kterou pracují.
  • Druhý - redukovaný - model zahrnoval všechny tyto proměnné, tedy kromě jediné: právě oněch diskutovaných tabulátorů/mezerníků

Oba modely dokázaly předpovědět (vysvětlit) plat programátora přibližně stejně. To podle Gabasové znamená, že údaj o tom, zda programátor používá tabulátory nebo mezerníky, nenese sám o sobě mnoho informací o tom, kolik dolarů najde daný programátor na výplatní pásce (Gabasová se ve své analýze zaměřila pouze na podskupinu amerických programátorů).

Další analýza ji přivedla k tomu, že lepším prediktorem vyššího platu bylo to, zda programátor uvedl, že se aktivně podílí na nějakém open-source projektu. „Ukázalo se, že lidé, kteří přispívají do open-source, používají mnohem častěji mezery. Ve skupině, která do open-source nepřispívá, byly mezery a tabulátory zastoupeny přibližně stejně.“

Vývojáři, kteří přispívají do open-source projektů, častěji používají mezery (vzorek: svět)

To může podle Gabasové přispět k vysvětlení zdánlivě nepochopitelného rozdílu v platech: „Podle mojí teorie se lidé, když pracují na projektu, který nemá jednotně daný styl formátování, častěji shodnou na mezerách, protože je to pro všechny konzistentnější.“

A proč že více vydělávají přispěvatelé do open-source? To není jisté, jedním z vysvětlení může být, že ti, kteří vydělávají více peněz, mají více času. Fungovat by to ale mohlo i opačně - vývojáři, kteří mají více zkušeností z open-source projektů, mohou být nadšenější, schopnější, flexibilnější atd.

Gabasová pak analyzovala i další aspekty, které už se netýkají mezer/tabulátorů, mimo jiné narazila i na ochotu/neochotu programátorů sdělovat svůj plat, což samozřejmě nadále ovlivňuje použitelnost dat pro takovouto analýzu.

20.června 2017 v 16:14, příspěvek archivován: 20.června 2017 v 21:23

My conclusions: it's more about your whole environment and how modern or old-school your company is, rather than if you use tabs and spaces https://t.co/5r5aNk9THr

Každopádně na všechny, kdo se rádi rochní v datech, čeká téměř 90MB CSV soubor na stránkách StackOverflow. Celkem obsahuje 154 sloupců a data od 51 392 respondentů, takže se v něm jistě skrývají i zajímavější témata, než je onen údajný (a vzápětí zpochybněný) vliv mezer a tabulátorů.

A pro programátory snad nemusíme dodávat, že pokud preferujete tabulátory, samotné přepnutí na mezery vám magicky dva a půl roku zkušeností v oboru nepřidá.

Při programování pro odsazení zleva používám:

celkem hlasů: 1964

Hlasování skončilo

Čtenáři hlasovali do 0:00 středa 28. června 2017. Anketa je uzavřena.

Klávesu tabulátor, která vkládá předem určený počet mezer
Klávesu tabulátor, která vkládá předem určený počet mezer 670
Programuji tak, že vypustím hejno motýlů a o zbytek se postará fyzika
Programuji tak, že vypustím hejno motýlů a o zbytek se postará fyzika 399
Klávesu tabulátor, která vkládá znak tabulátoru
Klávesu tabulátor, která vkládá znak tabulátoru 373
Mezerník, který vkládá mezeru
Mezerník, který vkládá mezeru 268
Zleva zásadně neodsazuji
Zleva zásadně neodsazuji 127
Vůbec netuším, co tady řešíte za nesmysly
Vůbec netuším, co tady řešíte za nesmysly 99
Mezerníkem vkládám mezery, které potom automaticky převedu na tabulátory
Mezerníkem vkládám mezery, které potom automaticky převedu na tabulátory 28
Autor:
  • Nejčtenější

Vtipně překonali „neřešitelný problém“, astronauti na ISS jsou nadšení

v diskusi je 32 příspěvků

27. února 2024  14:16

Barcelona (Od zpravodaje Technet.iDNES.cz) Udržet se třeba půl roku v uzavřeném nehostinném prostoru v dobré psychické i fyzické kondici je...

Chytrý telefon nahradí kartičkami a televizorem. Nevíme, zda nejdou pozdě

v diskusi je 15 příspěvků

28. února 2024  9:21

Barcelona (Od zpravodaje Technet.iDNES.cz) Překlenout „digitální propast“ mezi těmi, co mohou a nemohou, případně umí a neumí se snaží německý...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

To že má nahradit recepční? Největší exponát vyvolal spíš rozpaky

v diskusi je 12 příspěvků

26. února 2024  9:30

Barcelona (Od zpravodaje Technet.iDNES.cz) Velký zájem a údiv v různém smyslu slova vzbudil v předvečer veletrhu Mobile World Congress exponát...

I půl století po Apollu je přistání na Měsíci husarským kouskem. Proč?

v diskusi je 82 příspěvků

23. února 2024  18:14

Američané po více než 51 letech dosáhli povrchu přirozeného satelitu Země – Měsíce. Z laického...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Drahé, nebo předražené? Televizor Sony ukazuje kouzlo špičkových přístrojů

v diskusi nejsou příspěvky

1. března 2024

Stejně velký televizor se shodným rozlišením můžete koupit za desetinu ceny, stejně velký OLED...

VIDEO: Střílej po mně! Kameraman natočil téměř celý útok v centru Prahy

Premium Ve čtvrtek zemřelo rukou střelce Davida K. 14 obětí, 25 lidí je zraněných, z toho deset lidí těžce. Jedním z prvních na...

Máma ji dala do pasťáku, je na pervitinu a šlape. Elišku čekají Vánoce na ulici

Premium Noční Smíchov. Na zádech růžový batoh, v ruce svítící balónek, vánoční LED svíčky na baterky kolem krku. Vypadá na...

Test světlých lahvových ležáků: I dobré pivo zestárne v obchodě mnohem rychleji

Premium Ležáky z hypermarketů zklamaly. Jestli si chcete pochutnat, běžte do hospody. Sudová piva totiž dopadla před časem...

Na trh přijde tak za rok, ale už víme, jak bude chytrá elektronika vypadat

v diskusi je 1 příspěvek

2. března 2024

Barcelona (Od zpravodaje Technet.iDNES.cz) Chcete-li nahlédnout do blízké budoucnosti spotřební elektroniky, prohlédněte si nabídku prototypů...

Robopes do každé rodiny. Čínské modely kopírují jeden druhého

v diskusi je 8 příspěvků

1. března 2024

Barcelona (od zpravodaje Mobil.iDNES.cz) Nahradí robotičtí mazlíčci ty skutečné? Několik firem už pracuje na tom, aby se tak skutečně stalo....

Drahé, nebo předražené? Televizor Sony ukazuje kouzlo špičkových přístrojů

v diskusi nejsou příspěvky

1. března 2024

Stejně velký televizor se shodným rozlišením můžete koupit za desetinu ceny, stejně velký OLED...

T-Mobile se chystá na festivaly. Mobilní vysílač zprovozní za 30 minut

v diskusi je 6 příspěvků

29. února 2024

Barcelona (Od zpravodaje Technet.iDNES.cz) Festivaly, koncerty, velké sportovní události, demonstrace… Velká shromáždění lidí generují...

Bianca Censori šokovala Paříž odhaleným klínem, pokutě se však vyhnula

Architektka Bianca Censori (29), která je manželkou rapera Kanye Westa (46), opět šokovala veřejnost svými outfity. V...

Zemřela slovenská moderátorka, oblíbený byl její pořad, který pomáhal dětem

Zemřela moderátorka a logopedka slovenské dětské televizní stanice JOJko Lucia Palugyayová. Bylo jí 47 let. Na...

Princ William zrušil na poslední chvíli z osobních důvodů účast na akci

Britský princ William (41) odřekl svou účast na úterní vzpomínkové slavnosti na hradě Windsor. Na bohoslužbu za...

Nikdy jsem nebyla stydlivá, vzpomíná Heidi Janků na focení pro Luckyboy

Zpěvačka Heidi Janků (61) zavzpomínala na pobyt v Monaku, kam se přestěhovala kvůli práci svého manžela Iva Pavlíka. V...

Brzobohatý řádil v šatech a paruce. Poprvé veřejně jako Tiffany Richbitch

Ondřej Gregor Brzobohatý (41) vystoupil poprvé veřejně v šatech jako drag queen Tiffany Richbitch. Byl hostem druhého...