szmtag

Include Fuck Up: Swearing in GitHub-Versioning

Hihi, Coder auf GitHub beim Ausrasten. Könnte ich den ganzen Tag lesen:

- Change admin port to 6666 because fuck you
- Revert “fuck yeah, some fontz bro” This reverts commit bdd176631fc8894977acd1ff83cae431b24be23f. stop fucking my shit up
- FULLSCREEN BITCHES
- OMG MATH DID SOMETHING WRONG! HOLYSHITHOLYSHITHOLYSHITHOLYSHITH…

Commit Logs From Last Night – because real hackers pivot two hours before their demo

The A–Z of Music Journalism Bullshit

The Stool Pigeon hat ‘ne tolle Liste der schlimmsten Formulierungen des Musikjournalismus. Mein persönlicher Musikjournalism-Bullshit seit ein paar Jahren ist ja nach wie vor EDM. 1.) Gab es bereits in den 80ern Electronic Body Music, 2.) Ist zumindest heutzutage ohnehin nahezu jegliche Dance-Music elektronisch (wobei man natürlich streiten kann, ob Rock oder Punk nicht auch strenggenommen Tanzmusik sind)… jedenfalls: EDM, pfff, Bullshit. Hier meine Favorites:

Deconstructionist pop — sounds like Animal Collective

Elegantly wasted — Let’s be real: if you saw the pallid human blancmange that is Pete Doherty slinking down the street towards you in jeans and T-shirt, you’d give him the widest of possible berths. But give the man a trilby hat and a blood-spattered volume of symbolist poetry, and lo, he becomes “elegantly wasted”. It’s OK, we don’t get it either.

Pop for a perfect world — Trust us, you don’t want to know what a music critic’s perfect world looks like. But you can bet your ass it features Shins B-sides at numbers one to forty in the charts. And still they’d have the temerity to try and make a living from their self-important whingeing.

“Set the blogosphere alight” — Well done! Your innovative blend of Fleetwood Mac, nineties R&B and Sade — a singer you’d never even heard of before The xx started banging on about her — has “set the blogosphere alight” with your brand new track, featuring artfully NSFW video. That Pitchfork BNM’d is surely in the post.

Whiskey-soaked vocals — English lit polytechnic graduate, now based in Warrington, seriously wishes he was Tom Waits

An A-Z Guide to Music Journalist Bullshit (via Dangerous Minds)

Cthulhu Emoticons

Ph’nglui mglw’nafh Cthuloticons R’lyeh wgah’nagl fhtagn: /|\≈{;„„;}≈/|\ Iä Iä!

Basic (;,;)
Wide Body (;,,,;)
Blight Eyes (°,,,°)
Gull-wing ~^(;,;)^~
Ostentatious /|\(;,;)/|\
The European :€

6 ways to turn Cthulhu into an emoticon (via Daniel)

قلب: First Arabic Coding-Language as Art

 Youtube Direktقلب

Ramsey Nasser hat eine Programmiersprache namens قلب (‘Alb) in arabischer Kaligraphie programmiert, dazu musste er sämtliche Tools (Terminal, Texteditor) neu aufsetzen. Animal NY hat ein kleines Interview mit dem Mann, rumspielen kann man damit hier. Finde ich extrem spannend, auch wenn sich das alles erst im experimentellen Entwicklungsstadium befindet.

“قلب, as far as I know, is the first programming language that’s also a conceptual art piece,” says Ramsey Nasser, computer scientist and a fellow at New York’s Eyebeam Art+Technology Center. He can’t read the Russian hacker forums or the Chinese Twitter accounts buzzing about قلب (“alb”, “heart”), but he shows us how his terminal can understand Arabic calligraphy. It’s novel. It’s crucial. It’s incredibly exciting.

[…] programming seems to hate Arabic-speakers. Tools fall apart reading Arabic. Interfaces break. Terminals crash. Text readers don’t know what to do with it. “Practically speaking, it’s more sensible to just learn English in order to learn code. That shocked me,” says Nasser. “I believe that code and computation should be something anyone can access.”

And so, Nasser set out to create a non-Latin Lisp in Arabic calligraphy from scratch. The challenge was immense. Every tool had to be custom made. Relatives were recruited for linguistic assistance. And viola…

ARABIC PROGRAMMING LANGUAGE AT EYEBEAM: قلب OPENS THE WORLD

Iambic Pentameter Poetry via Twitterbot

Pentametron ist ein Twitterbot, „To find inadvertent poetry in the endless torrents of language that slosh around the internet“ – der Tweets auf ihren Sprachrythmus analysiert und retweetet, wenn sie in den jambischen Fünfheber passen. Funktioniert stellenweise erstaunlich gut: „The truest. Never.ever.look.the.same. I’m so addicted to the Simpsons game.“

These sonnets are being built in realtime by digging through hundreds of thousands of tweets per hour looking for only those few which happen to be in iambic pentameter. These tweets are retweeted on the @pentametron twitter feed and collected here in an approximation of sonnet form.

Pentametron takes each of the 30-60 tweets it receives each second, and looks up each word in a dictionary which lists the stress patterns of every word. If the rhythms of all the words put together seem to add up to iambic pentameter, Pentametron considers the tweet as a possible rhyme.

Pentametron (via Daniel)

Ordering a Pizza with Voice Synthesizer, 1974

 Youtube Direktpizza, via Coudal

Vor zwei Jahren hat das Artificial Language Laboratory das 35jährige Jubiläum der ersten Anwendung künstlicher Sprachausgabe gefeiert. Damals, im Jahr 1974, haben sie eine Pizza bestellt.

This high-tech sociolinguistic experiment was conducted at the Lab on the evening of December 4, 1974. Donald Sherman, who has Moebius Syndrome and had never ordered a pizza over the phone before, used a system designed by John Eulenberg and J. J. Jackson incorporating a Votrax voice synthesizer, a product of the Federal Screw Works Co. of Troy, Michigan.

Google Translated Fresh Prince of Bel-Air

 Youtube Direktbelair, via Gawker

Das Intro vom Bel-Air-Prince tausendmal durch Google Translate gejagt und das Ergebnis dann neu gerappt. Ich fand die Serie übrigens immer sehr scheiße, aber das hier ist super. Tolle Idee!

Designjargon Bullshit:

Designjargon Bullshit, mit Perlen wie: „We distilled the clients personalities and created a brand positioning statement that defined their core identity.“

Fucking AI Watson learns the Urban Dictionary

Ihr erinnert Euch an Watson, die AI, die damals bei Jeopardy gewonnen hatte? Kurz danach wollten sie seine Sprachausgabe verbessern und natürlicher klingen lassen, also hat Watson das Urban Dictionary gescannt und daraufhin seine Wissenschaftler beschimpft, so dass sie ihm einen Sprachfilter für Schimpfworte programmieren mussten. Die Story ist wahrscheinlich ziemlich hochgejazzt – wenn da steht, dass Watson „even reportedly used the word ‘bullshit’“, dann dürfte insgesamt nicht allzuviel passiert sein –, aber ich mag die Idee einer fluchenden AI sehr.

2011, shortly after Watson’s reign as Jeopardy! champ, Brown taught Watson the Urban Dictionary. What could’ve been another landmark for Watson — being able to participate and enjoy in a full conversation using natural, informal human language — turned out to be a step in the wrong direction. […]

Watson unfortunately learned all of the Urban Dictionary’s bad habits, including throwing in overly-crass language at random points in its responses; in answering one question, Watson even reportedly used the word “bullshit” within an answer to one researcher’s question. Brown told Forbes that Watson picked up similarly bad habits from reading Wikipedia.

In the end, Brown and his team were forced to remove the Urban Dictionary from Watson’s vocabulary, and additionally developed a smart filter to keep Watson from swearing in the future.

IBM’s Watson Gets A ‘Swear Filter’ After Learning The Urban Dictionary (via /.)

Language identifies Users of Online Underground Markets

Aylin Caliskan Islam und Sadia Afroz hielten auf dem 29c3 einen superspannenden Vortrag mit dem Titel Stylometry and Online Underground Markets, in dem es um die Identifikation anonymer User anhand ihres „Sprachabdrucks“ ging, wobei: „Leetspeak, an alternative alphabet popular in some forum circles, cannot be translated“. Mir war das als interessierter Linguistik-n00b allerdings insgesamt zu hoch, aber das Security Business Mag hat den Vortrag für Normalnerds runtergebrochen:

Up to 80 percent of certain anonymous underground forum users can be identified using linguistics, researchers say. The techniques compare user posts to track them across forums and could even unveil authors of thesis papers or blogs who had taken to underground networks. “If our dataset contains 100 users we can at least identify 80 of them,” researcher Sadia Afroz told an audience at the 29C3 Chaos Communication Congress in Germany.

“Function words are very specific to the writer. Even if you are writing a thesis, you’ll probably use the same function words in chat messages. “Even if your text is not clean, your writing style can give you away.” The analysis techniques could also reveal botnet owners, malware tool authors and provide insight into the size and scope of underground markets, making the research appealing to law enforcement.

Linguistics identifies anonymous users: Researchers reveal carders, hackers on underground forums (via /.)

English Letter Frequency Counts per Google Books Analysis

Peter Norvig hat Mark Mayzner 1960er Studie über die Häufigkeit von Buchstabenkombinationen in der englischen Sprache per Google Books aktualisiert.

Here are the 24 words with length of 20 or more (that are mentioned at least 100,000 times each in the book corpus):

electroencephalographic
polytetrafluoroethylene
forschungsgemeinschaft
deinstitutionalization
counterrevolutionaries
dehydroepiandrosterone
electroencephalography
immunoelectrophoresis
institutionalisation
acetylcholinesterase
internationalization
institutionalization
radiopharmaceuticals
electroencephalogram
keratoconjunctivitis
counterrevolutionary
immunohistochemistry
internationalisation
hypercholesterolemia
phosphatidylinositol
compartmentalization
electrophysiological
electrocardiographic
uncharacteristically

English Letter Frequency Counts: Mayzner Revisited or ETAOIN SRHLDCU (via Adafruit)

200 Jahre Märchen der Gebrüder Grimm

Es war einmal vor ganz genau 200 Jahren, da veröffentlichten die zwei Brüder Jacob und Wilhelm Grimm den ersten Band ihrer Sammlung von Sagen und Märchen, die sie in den vergangenen sechs Jahren aus mündlichen Überlieferungen zusammengetragen und überarbeitet hatten. Damit begründeten sie nicht nur die Märchenforschung, sondern sicherten die Überlieferung uralter Sagen und Mythen aus dem deutschen Sprachraum bis weit in die Zukunft, ihre Märchensammlungen sind ohne Zweifel einer der wichtigsten Beiträge zur deutschen Literatur überhaupt.

In meiner Familie gab’s natürlich ein Märchenbuch und zwar genau das rechts, „Die schönsten Märchen der Brüder Grimm“ mit Illustrationen von Herbert Lentz aus dem Jahr 1972. Daraus hat mir meine Oma immer vorgelesen, so wie wahrscheinlich jedem anderen Kind auch. Ich werde erst gar nicht versuchen zu beschreiben, welchen Einfluss die fantastischen Geschichten auf Kids haben, stattdessen hier meine Top10 meiner Lieblingsmärchen der Grimms, die Top3 (Gewalt, Horror und Satan) dürften regelmäßige NC-Leser nicht besonders überraschen:

10. Die goldene Gans
9. Die Bremer Stadtmusikanten
8. Sechse kommen durch die ganze Welt
7. Jorinde und Joringel
6. Rumpelstilzchen
5. Daumerlings Wanderschaft
4. Schneeweißchen und Rosenrot
3. Tischlein deck’ dich, Goldesel und Knüppel aus dem Sack
2. Märchen von einem, der auszog, das Fürchten zu lernen
1. Der Teufel mit den drei goldenen Haaren

Hier ein ganzer Haufen Links zu den Grimms, hier erstmal ein paar Teile der japanischen Anime-Serie in einer YT-Playlist:

FAZ: 200 Jahre Grimms Märchen – Schlaffer Hänsel, taffe Gretel
Frankfurter Rundschau: 200 Jahre Märchen der Brüder Grimm

Das Feuilleton des Deutschlandradios widmet den Grimms heute den kompletten Tag: „Dass ihre Märchensammlung ein internationaler Bestseller werden würde, hätten sich Wilhelm und Jakob Grimm wohl nicht träumen lassen. Schneewittchen, Froschkönig, das tapfere Schneiderlein und Aschenputtel sind bis heute unvergessen. Am 20. Dezember 2012 jährt sich die Veröffentlichung der Kinder- und Hausmärchen zum 200. Mal, das “Grimm-Jahr” wird damit offiziell eingeläutet.“

Hier noch ein Artikel beim DRadio: Es war einmal vor 200 Jahren – Die Gebrüder Grimm haben den ersten Teil ihrer “Kinder- und Hausmärchen” fertiggestellt.

Es waren einmal zwei Brüder, die hatten früh ihren Vater verloren. So war zuhause oft Schmalhans Küchenmeister. Und die beiden sollten früh ihr Geld verdienen, um ihre jüngeren Geschwister mit zu ernähren. Wenn nicht ihre Tante Kammerzofe der Fürstin gewesen wäre, so hätten sie wohl gar nicht studieren können. So aber wurden sie beide berühmte Gelehrte, die sich der Erforschung der deutschen Sprache und Literatur widmeten. Sie sammelten alte Lieder und Heldensagen, Legenden – und Märchen.

hr2 Wissenswert hat eine Podcast-Reihe zum 200sten:
Reale Märchenwelten: ein romantisches Projekt: Den Grimms halfen viele – vor allem bürgerliche – Frauen bei der Sammlung ihrer Märchen.
Reale Märchenwelten: von Hanau nach Berlin: Das Leben der Brüder Jacob und Wilhelm Grimm.
Reale Märchenwelten: warum Kinder Hexen brauchen: Die Wirkung von Märchen in Schule und Familie.
Reale Märchenwelten: Grimms weltweit: Glück, Gesellschaft und Grimms Märchen, ein weltweites Theaterprojekt.

Mickey The Pixel hat auf Flickr dreitausend alte Märchenbücher, zu den Grimms habe ich die hier gefunden (sämtliche Bilder in diesem Posting stammen von dort):
Kinder- und Hausmärchen gesammelt durch die Brüder Grimm mit Illustrationen von Philip Grot Johann und Robert Leinweber, Deutsche Verlags-Anstalt (Stuttgart, Leipzig, Berlin, Wien; o.J. > um 1900)
Märchen von Gebrüder Grimm, Buchschmuck von Robert Weise, Union Deutsche Verlagsgesellschaft (Stuttgart, Berlin, Leipzig; 1890)
Die schönsten Kinder-Märchen der Brüder Grimm, Illustrationen: Paul Hey, K. Thienemanns Verlag (Stuttgart / Deutschland; ~1935)
Deutsche Märchen, Gebrüder Grimm, Märchenbuch / Sammelalbum, Cover: Helmut Starbina, Bilder: Professor Paul Hey, Herausgeber: Cigaretten-Bilderdienst (Hamburg/Deutschland; 1939)

Nach dem Klick ein paar meiner Lieblingsillus aus den Flickr-Sets: Gib mir den Rest, Baby…

List of iOS-Emoji:

„iOS Emoji by Eric Fredricksen. This’ll only work on Safari.

Satanist Lulz from Hell

Das Bild rechts hatte ich vor ein paar Wochen bereits bei Daniel gesehen, die satanistische Sammlungen auf Reddit mit Lulz from Hell habe ich allerdings verpasst.

YOLO – Youth Obeying Lucifer’s Orders
SWAG – Satan’s Wishes Are Granted
ROFL – Rise, Our Father Lucifer
EPIC – Evil People In Church
LMAO – Lucifer massacres all oppressors
BRB – Beelzebub Rules Below.
WTF – Worship the fallen
TIL – Turn Into Lucifer
NSFW – Now Satan Fulfills Wishes
TL;DR – Trust Lucifer; Die Rich
ASL – All Supreme Lucifer
TROLL – The Righteous Omniscient Lord Lucifer
NSFW – Nailing Satan’s Funky Wormhole
LMFAO – Lucifer Must Fulfill All Omens
LMFAO – Lucifer Might Fuck A Orangutan
STD – Satan Transmitted Disease

I seriously hope this guy is kidding (via Dangerous Minds)

The Linguistics of Drug-Stories

Jemand, der sich selbst nur Melody nennt, hat beim Scientific American einen langen, tollen Artikel über die Sprache aus Drogenerfahrungsberichten aufgeschrieben. Dazu hat er oder sie die Experience-Datenbank von Erowid.org gescannt und die Daten ausgewertet. Eine linguistische Studie über „Whoa, hast Du auch grade dieses ganz grelle Licht gesehen?“ (<-- Standardspruch und Zitat aus Terminator 1, den ich niemals in meinem Leben auf Acid-Trips gebraucht habe.) Fuck yeah, Science!

The use of drugs beyond the pale – of acid and ketamine, vicodin and methamphetamine, pills, poppers, angel dust, tweak, molly, aunti, alice, susie-Q (and so on) – is stigmatized, marginalized, made to exist in backrooms and alleys, rather than coffeehouses and bars. […] That drug use is taboo, even for being so readily on display, is reflected in our language. There are straight-edge folk who can use “high” or “drunk” in a sentence, like a blind child who knows the sky is blue, and it seems they have some idea what they’re saying (though likely all they know is a bit about language, and the way words go together). But what of drop, trip, toke, roll, jack, score, smack, sniff, pack, peak, split, blow? Everyday words, surely, but ones that, in the mouth of the drugstore cowboy, acquire meanings altogether different from their common use. […]

What makes these visualizations possible? The usage data was gleaned from a manually-created corpus of single-drug experiences, which comprises the top twenty-five public postings on Erowid for each of the selected drugs. Erowid is a popular drug library that hosts open forums in which users share their experiences, along with detailed information about the amount and preparation of what they ingest, imbibe, inject, and so on.

Visualizing the Language of Drug Experience (via Protein)