Gebt uns die Kaffeepause zurück!

Die besten Ideen entstehen bei zufälligen Begegnungen. Wer rettet uns aus der unkreativen Videokonferenz? Die Virtuelle Realität.

13 Minuten
Eine Kaffeetasse steht auf einem Tisch vor einem Laptop. Auf dem Laptop findet eine Videokonferenz statt.

Virtuelle Plattformen bilden das nach, was uns in der Videokonferenz fehlt: zufällige Begegnungen, freie soziale Interaktion und unverbindliche Gespräche, ohne sich von 20 Augenpaaren beobachtet zu fühlen. Und das zunehmend einfach und auf allen Geräten. Werden wir uns so in Zukunft digital begegnen? Ein Besuch bei verschiedenen Startups.

Vishal Punwani lädt Besuch dieser Tage immer direkt in sein Büro ein. Zwischen gemütlichen Sitzecken mit Sofas, Zimmerpflanzen, einer Kaffeebar mit Barhockern und einer Tischtennisplatte stehen hier und da Schreibtische mit Computern darauf, in einer Ecke hinter Glasscheiben eine Yoga-Matte, in einer anderen Ecke ein Beamer und eine Leinwand mit kinoartig davor aufgebauten Stühlen und daneben eine Spiele-Konsole mit großem Bildschirm. Neben der Tischtennisplatte stehen zwei Kollegen des Startup-Gründers und diskutieren über aktuelle Entwicklungen, und auch in der Mitte des Raumes unter einer der ausladenden Büropalmen stehen zwei Kolleginnen und betrachten gemeinsam einen Bildschirm voller Programmiercode. „Hier müssen wir noch etwas anpassen“, sagt eine der beiden.

Punwani hat wohl eines der schönsten und flexibelsten Büros. Und das beste: Es ist vollkommen digital. Er kann es von jedem Ort auf der Welt aus betreten – er braucht dafür nur das Internet und einen Computer. Auch seine Kollegen sind nicht materiell vor Ort, sondern in Form von Avataren, die sich selbst auf ihrem Bildschirm von oben sehen und sich mit Tastatur oder Maus durch eine Art Computerspiel-Welt fortbewegen können. „Sophya.ai“ heißt die Plattform, die Punwani mit seiner Mitgründerin Emma Giles aufgebaut hat. Man könnte Sophya als eine Zoom-Alternative beschreiben mit der Möglichkeit, sich seine Breakouts spontan und autonom zusammenzustellen. Wenn man sich den beiden Frauen nähert, die gerade über dem Programmcode brüten, öffnet sich die eigene Kamera sowie deren Kamerabild: Jetzt befinden wir uns in einer Videokonferenz mit der Funktion „Bildschirm teilen“ – im Hintergrund sind weiterhin unsere eigenen Avatare zu sehen, die Tischtennisplatte, die Arbeitstische und die anderen Mitarbeiter-Avatare aus der Vogelperspektive.

In der Kantine des virtuellen Büros, das in der Grafik eines Retro-Videospiels dargestellt wird, treffen sich die Avatare von Personen. Da die Avatare der Journalistin und Vishal Punwani nahe zusammenstehen, haben sich in der oberen rechten Ecke zwei Video-Fenster geöffnet, über die nun eine Unterhaltung möglich ist.
Für das Interview läd Sophya-Mitgründer Vishal Punwani die Journalistin in seine virtuellen Geschäftsräume ein – inklusive Kantine. Essen und Kaffee muss man sich aber weiterhin selbst besorgen.

Ein Gefühl von Gemeinschaft

Die Art zu interagieren ähnelt der einer Party oder auch einer Konferenz, bei der man sich von einem Grüppchen zum nächsten treiben lässt, eine zufällige Art der Begegnung. Oder eben dem Zusammenkommen im Büro: Andere Menschen sind da, und wenn man etwas von ihnen möchte, spricht man sie an – ansonsten arbeitet jeder für sich, gemeinsam im gleichen Raum, wissend, dass man nicht alleine ist.

Genau das hat Punwani und seine Kollegin angetrieben. Denn eigentlich ist die Plattform Sophya aus Versehen entstanden. Ursprünglich – und noch immer parallel – arbeiten die Gründer, die im Harvard Innovation Lab gestartet sind, an der Zukunft des Lernens. Ihre Software soll Schülern und Studierenden helfen, personalisierte Lerninhalte zu bekommen, die genau auf sie und ihren Lernstand und Lerntyp zugeschnitten sind. Doch dann kam die Pandemie und die Gründer sahen an den Unis auf einmal ganz andere Probleme: „Wie können Schüler, Studierende und Lehrer sozial in Kontakt bleiben?“, fragt Punwani.

Er hat im März 2020 fünf Doktoranden um sich geschart, die alle beschlossen hatten, ein Jahr Pause einzulegen von ihren Promotionen an der Harvard University, weil ein digitales Studium nur der halbe Spaß ist. So hatte Punwani plötzlich ein kleines Unternehmen – nur saßen alle im Homeoffice, und irgendwie fehlte das Gemeinschaftsgefühl. „Zoom hat uns nicht geholfen, das hat so viel des „Zwischendrin“ nicht, das das echte Leben hat.“ Beispielsweise die spontane Diskussion in der Kaffeeküche, aus der oft die besten Ideen entstehen. Oder die Möglichkeit, mit den Kolleginnen und Kollegen in einem Raum zu sein, ohne aktiv zu kommunizieren.

„Zoom hat uns zu sehr in Boxen gesperrt“, ergänzt Punwanis Kollege Anuj Adhiya, Vice President of Growth bei Sophya. „Sie bauen einen starren Rahmen um so etwas Unstrukturiertes wie soziale Beziehungen.“ Ihm habe in den Videokonferenzen die sozialen Signale gefehlt, die helfen, die Umgebung einzuschätzen.

Von „World of Warcraft“ zum virtuellen Büro

Doch Punwani wusste, was zu tun ist. Mit einigen seiner heutigen Kollegen hatte er vor 16 Jahren ausgiebig „World of Warcraft“ gespielt, ein Multiplayer-Spiel, bei dem verschiedene Spieler remote miteinander agieren. Eine Zeit lang war das Punwanis zweites Wohnzimmer geworden, damals. „Im März saßen wir wieder jeder allein zu Hause, unserer Designer in Seattle, ein anderer Kollege in Australien, ich in Kanada. Und wir wussten vom Spielen, wie man einen sozialen Treffpunkt gestalten muss, in dem sich Menschen zu Hause fühlen.“ Kein Wunder, dass Sophya.ai eine retro Computerspiel-Optik hat.

Das Konzept scheint aufzugeben. Kaum war Sophya online und kaum hatte Punwani erste Interessierte in sein Büro eingeladen, wurde er regelrecht überrannt von Menschen, die – wie er – müde waren von Videokonferenzen. „Ich habe noch nie Schulen und Unternehmen so schnell reagieren sehen“, sagt Punwani. „Jeder wusste, wie sehr uns die Pandemie und Videokonferenzen auseinandergebracht hatten.“ Adhiya trifft seither immer wieder Fremde, die im Büro abhängen – „einfach weil es ihnen gefällt.“ Noch kann jeder einfach das Büro betreten, der den richtigen Link hat, „wir machen das so weiter, solange es keine Probleme gibt.“ Schließlich werden bei vollen Räumen einfach entsprechende Ausweichräume geöffnet, und es gibt jede Menge weitere Räume zum Auswählen, darunter eine Bar, einen Friedhof und einen Park. „Und immer mehr Nutzer merken, dass sie einen eigenen Raum haben wollen, exklusiv für ihr Unternehmen.“ Das ist das Geschäftsmodell von Sophya.

Ähnlich erging es dem deutschen Startup Wonder: auch auf dieser Plattform können sich Menschen in Form von Avataren mit ihrem Profilbild frei bewegen und sich zu sogenannten Bubbles zusammenfinden, spontane Gesprächsrunden. Auch hier öffnen sich Kamera- und Tonkanal, sobald Nutzer in die Nähe anderer kommen. Zudem lassen sich verschiedene Konferenzräume einrichten, und Kunden können ihren Wonder-Raum selbst gestalten, beispielsweise mit dem Foto einer Bar im Hintergrund für das Feierabendbier oder einer Videoübertragung in einem Konferenzraum, während im anderen Raum eine Podiumsdiskussion stattfindet, und Besucher vor dem Warteraum miteinander smalltalken können. Seit die Plattform im Juni 2020 online ging, bestehe eine enorme Nachfrage, erklärt Mitgründer Stephane Roux: „Wir haben derzeit ein wöchentliches Wachstum von 30 Prozent.“

Das Büro neu erfinden

Spannend findet er vor allem die Evolution der sozialen Interaktion auf der Plattform. „Virtuelle Räume sind ein neues Feld für die Menschen, neue Umgangsformen bilden sich erst mit der Zeit.“ So beobachtete er, dass viele Kunden zunächst versuchten, ihre Umgebung so originalgetreu wie möglich ihren bisherigen Büros oder Treffpunkten anzupassen. „Dann kommt man irgendwann darauf, dass das eigentlich keinen Sinn ergibt: Die Aufteilung im Büro war doch nur so, weil das Gebäude so teuer war.“ Im Digitalen lässt es sich anders gestalten. Roux empfängt die Journalistin ebenfalls im Büro des Startups, das recht abstrakt gehalten ist. Der Hintergrund besteht aus einem dunkelblauen, leicht psychedelischen Muster, darauf mehrere Rechtecke: ein Warteraum, zwei Konferenzräume, und – ganz wichtig: ein Raum mit einem Wasserkühler – das muss das Äquivalent zur Kaffeeküche sein! Roux bestätigt das: „Oft stellen sich Menschen zum Wasserkühler, um zu signalisieren, dass sie bereit sind für ein Gespräch.“

So könne man die räumliche Aufteilung zum Interaktionsprinzip machen – Designentscheidungen werden dadurch automatisch auch Entscheidungen über die erhoffte soziale Interaktion. Während des Interviews vor dem Warteraum treffen sich zwei Kollegen von Roux im Konferenzraum 2. „Wir könnten dort jetzt hingehen, aber wir tun es nicht, weil man im echten Leben auch nicht einfach in eine Besprechung hineinplatzen würde“, sagt Roux. So entwickeln sich passende Umgangsformen wie im analogen Leben.

Während die Wonder-Kunden die Plattform mehrheitlich für einmalige Veranstaltungen nutzen wie Meetings, Konferenzen oder Alumni-Treffen, nutzen Roux, seine Gründerkollegen Leonard Witteler und Pascal Steck sowie die inzwischen rund zehn Mitarbeiter die Plattform als Büro. Ähnlich wie Punwani von Sophya schätzen Roux und seine Kollegen das Gefühl, zusammen zu arbeiten wie im analogen Büro und die Möglichkeit, sich kurz und spontan abzustimmen. Anders als im echten Leben herrsche in einem virtuellen Büro natürlicherweise mehr Kommen und Gehen, da der Anfahrtsweg ja denkbar kurz ist. „Es ist ein Zwischenzustand zwischen Zoom und immer zusammen zu sein“, sagt Roux. Schließlich sei es „ein bisschen stressig, wenn man den ganzen Tag sichtbar ist.“

Zoom fatigue

Das ist genau das, was uns so erschöpft, wenn wir viel in Videokonferenzen sind, erklärt Robin Welsch. Der Psychologe beschäftigt sich an der Münchener Ludwig-Maximilians-Universität mit Fragen des Raumempfindens in virtuellen Welten. „Wir werden auf Zoom die ganze Zeit angeschaut, und wir können diesen Blick nicht interpretieren. Das verursacht Zoom fatigue, also diese Erschöpfung nach Videokonferenzen.“ Denn während im echten Leben quasi von selbst klar ist, wer gerade spricht und wer wen anschaut, schauen bei Videokonferenzen alle aus dem Bildschirm einen selbst an. „Sie fokussieren mich, sogar wenn ich nicht der Sprecher bin“, sagt Welsch – und da hilft auch das rationale Wissen darüber nichts, dass es nur so wirkt und dass die anderen Teilnehmer wahrscheinlich den Sprecher anschauen. „Wir verarbeiten diese andauernden sozialen Signale die ganze Zeit im Hinterkopf, und das ist anstrengend.“

Bei Zusammentreffen in der analogen Welt hingegen gibt es viel mehr soziale Signale, die uns helfen, Situationen einzuschätzen. „Allein die Komponente der räumlichen Nähe und Distanz zeigt sehr eindeutig, wer mit wem spricht.“ Das sei ein Faktor, den Plattformen wie Sophya, Wonder oder auch Gathertown zumindest ansatzweise abbilden – und das helfe schon.

Gathertown funktioniert ähnlich wie eine Mischung aus Sophya und Wonder und lässt seine Nutzer Avatare und Räume selbst gestalten. Ein ähnliches Ziel hat Remo auf eine sehr reduzierte Art: auch hier können sich Nutzer ihre Diskussionsgruppen frei aussuchen, indem sie sich an einen Tisch setzen, an dem schon andere sitzen. Hier ist allerdings das Problem, dass Tisch irgendwann voll sind – und das Ganze dann etwas unflexibel wird. Zudem ergeben sich keine zufälligen Begegnungen durch Herumschlendern wie in Wonder oder Sophya. So könne man in diesen Plattformen ein Gespräch starten, indem man sich jemandem räumlich nähert – ähnlich wie im echten Leben, sagt Welsch. „Ich spreche hingegen auf Zoom niemanden an und sage „lass uns mal in einen Breakout-Room gehen.“ Die räumliche Beziehung sei ein Indikator für das soziale Engagement.

Soziale Interaktion ist mehr als „ein“ oder „aus

Aber all diese Lösungen haben einen Nachteil: Sie können nur einen winzigen Teil dessen ersetzen, was uns aus dem echten Leben fehlt. Größte Schwachstelle: Bei den Begegnungen gibt es nur „ein“ oder „aus“ – ein Schritt zu weit weg, schon schließt sich die Verbindung. Im echten Büro würde ich dennoch zumindest einige Wortfetzen aufschnappen und könnte vielleicht neugierig werden und mich dazu gesellen. Hier muss ich noch immer aktiv einen Kanal öffnen und wieder schließen, wenn mich das Thema nicht interessiert – was als unhöflich erscheinen könnte. „Es fehlt der informelle Austausch, das Tuscheln mit meinem Nebensitzer während eines Vortrags beispielsweise“, sagt Welsch. Gerade bei Konferenzen sei zudem der Networking-Effekt wichtig: dass beispielsweise der Professor seinen neuen Doktoranden Kolleginnen und Kollegen vorstellt, die sich mit ähnlichen Themen beschäftigen und die beide zufällig in der Kaffeepause treffen.

Diese weitere Ebene war bislang VR-Enthusiasten vorbehalten, die Headsets besitzen und sich in sozialen virtuellen Welten treffen, die sich sehr viel mehr wie das echte Leben anfühlen. Doch so langsam werden solche Welten auch zugänglich für Desktop-Nutzer. Die open source Plattform Mozilla Hubs beispielsweise ist eine der wenigen und ersten „echten“ virtuellen Welten, die auf allen Geräten funktioniert. Hier können sich Nutzer mit VR-Headset in selbst gestalteten dreidimensionalen Räumen völlig immersiv bewegen und auch Nutzer treffen, die per Desktop-Computer unterwegs sind. Hier gibt es komplettes räumliches Audio: das heißt, Nutzer, die nahe beisammenstehen, hören sich lauter, während andere weiter weg nur schwach zu hören sind, Wortfetzen oder auch nur ein Murmeln. Flüstern ist möglich, ebenso wie Networking und zufällige Begegnungen.

Verschiedene Anbieter haben versucht, diese Art der Plattform nachzubauen, in Deutschland unter anderem Tricat Spaces aus Ulm und Bizzlogic aus Hamburg. Doch in der Praxis ergaben sich zahlreiche Probleme. So mussten die Konferenzbesucher bei letzterem Anbieter zunächst 3 Gigabyte auf ihre Rechner herunterladen, die vor jedem Konferenztag erneut aktualisiert werden mussten, was viel Zeit in Anspruch nahm. Auf zahlreichen geschäftlichen Computern funktionierte das zudem nicht wegen der Firewall-Einstellungen.

„Echte“ Virtuelle Realität für alle

Doch auch hier gibt es nun ein Startup, das eine cloudbasierte Variante von „echter“ VR für alle Geräte anbietet: „Wir streamen virtuelle Realitäten“, sagt Thomas Johann Lorenz, Mitgründer von Journee. Nutzer müssen also nicht zuvor gigabyteweise Daten herunterladen, sondern die aktuelle Version der Welt wird in Echtzeit vom Server gestreamt. Die fotorealistischen dreidimensionalen Umgebungen laden auf jedem Gerät innerhalb weniger Sekunden – auch auf dem Smartphone, verspricht der Gründer, während er in einer Präsentation Beispiele der Welten zeigt, die Journee bereits umgesetzt hat. Eine Umgebung aus saftigem grünen Farn, Bäume, deren Blätter im Wind schwingen, durchbrochen von Sonnenstrahlen und Kunstskulpturen, zwischen denen sich Avatare treffen. Lorenz kann nicht in die Realität von Journee einladen, denn es gibt DIE Realität nicht. Die Agentur baut für jeden Kunden individuell, was er sich wünscht.

So habe man kürzlich das Gebäude der Bitcom eins zu eins nachgebaut, in dem diese ihre Events abhalte. Dafür wurde das originale Gebäude mittels eines 3D-Scanners aufgenommen und daraus ein dreidimensionales Modell erstellt. So kannten sich die Event-Besucher bereits aus. Und natürlich war es auch dort die original nachgebaute Kaffeeküche, die die Menschen anzog: „Hier läuft man sich zufällig über den Weg und kommt ins Gespräch, wie im echten Leben.“ Nur den Kaffee musste jeder selbst kochen.

Auch Journee wurde durch die Pandemie in die Entwicklung virtueller Welten getrieben. Die Gründer kommen von der Kommunikationsagentur Waltz Binaire, die normalerweise Marken auf großen Events in Szene setzt. „Im März saßen wir plötzlich alle vor Bildschirmen“, erinnert sich Lorenz. So kam der Bedarf nach etwas Neuem, einer anderen Art sich zu begegnen im virtuellen Raum jenseits von Videokonferenzen und gestreamten Events. Ende Oktober gab es schließlich das erste Event für einen Kunden, „und seither wird uns die Bude eingerannt“, sagt Lorenz. „Bis März hatte sich das niemand als einen Markt vorgenommen.“

Und nach der Pandemie?

Aus seiner Sicht dürfen aber nicht stur physische Formate eins zu eins ins virtuelle übertragen werden. „Ein Konferenzformat über drei Tage auf Video hat keine Existenzberechtigung im Internet“, behauptet Lorenz. Im Kampf um die Aufmerksamkeit im Internet sei es wichtig, kurzweilige, interaktive Formate anzubieten. So habe Journee für Siemens kürzlich eine Welt für eine globale Konferenz gebaut, in der Teilnehmer an einem Strand entlang laufen konnten und um ein Lagerfeuer herumstehen, ein Feuerwerk starten und mit Sekt anstoßen. VR-Enthusiasten mit eigenem Headset kommt das nicht neu vor, es gibt zahlreiche virtuelle Welten, in denen solche Dinge bereits möglich sind. Doch auf Desktop und Smartphone ist es neu.

Während viele Menschen überzeugt sind, dass klassische Videokonferenzen nach der Pandemie deutlich an Attraktivität verlieren werden, ist das Feedback zu diesen neuen, räumlicheren Formen des digitalen Zusammenkommens gemischter. Werden diese neuen Plattformen also ändern, wie wir uns künftig begegnen? Es kommt darauf an: „Ich glaube nicht so sehr an virtuelle Events, aber Erlebnisse“, sagt Lorenz. „Angenommen, es gäbe nur das Internet und keine analogen Events: Es käme niemand auf die Idee, dass sich tausende Menschen gemeinsam treffen, um ein Video anzuschauen. Die Einzigen, die danach fragen, sind die Unternehmen, die bisher Events gemacht haben.“ Aus seiner Sicht werden klassische Events weiter im analogen Leben bestehen, aber ergänzt und eventuell teilweise ersetzt durch interaktive Erlebnisse im Internet, die es vor der Pandemie nicht in dieser Form gab.

Wonder-Gründer Stephane Roux zuckt nur mit den Schultern auf die Frage, ob die neue räumliche Art der virtuellen Kommunikation ein Pandemie-Thema sei. Die Situation sei zwar ein Treiber, doch die Idee sei weit älter gewesen wären. Auch er und seine Mitgründer hatten eigentlich einen anderen Plan für eine Gründung rund um Hochzeitsfotografie – „doch dann gab es auf einmal keine Hochzeiten mehr.“ So holten die Gründer ihre alte Idee aus der Tasche. Das Thema komme ja gerade erst auf: „Das ist kein Pandemie-Thema, es ist ein Post-Pandemiethema.“

VGWort Pixel