ricardo vice santos

De walkie-talkie a interface de voz para fazer tudo? ‘Roger that’

O jet lag era visível, mas não se sobrepunha ao entusiasmo em contar a história sui generis que deu origem à interface de voz Roger: chocou contra um poste enquanto enviava uma mensagem a um amigo que se encontrava na Suécia. Estava, então, na altura de criar uma app que permitisse interagir com amigos e diversos serviços, como Slack, Facebook ou Twitter, através da fala, trilhando um percurso que, a pulso, o fez chegar ao top 100 de personalidades mais criativas do mundo empresarial de acordo com a Fast Company.

Ricardo Vice Santos, o primeiro português a integrar esta lista, viajou de Nova Iorque, onde vive, até Lisboa para marcar presença no Landing.jobs Festival, uma feira de emprego tecnológico que decorreu nos dias 3 e 4 de junho em Lisboa. Não perdemos a oportunidade de saber mais sobre os planos que tem para o serviço Roger e sobre a sua visão empreendedora. Para o ex-engenheiro do Spotify, a voz será a “próxima grande plataforma”.

 

O Roger permitiu, recentemente e pela primeira vez, falar com a assistente virtual da Amazon, a Alexa, gratuitamente, mas integra também muitos outros serviços como o Slack, Dropbox, SoundCloud, Facebook ou Twitter, pelos quais se podem enviar clips de voz. É nesta direção que pretendem progredir?

Sempre foi essa a ideia. Na noite em que fizemos o projeto, fomos jantar a um restaurante ao pé de minha casa e o pedido estava a demorar muito tempo. Lembrei-me de sugerir ao [Andreas] Blixt, o meu cofundador, que fizéssemos algo que permitisse perguntar ao chef quais eram as especialidades da casa e encomendar pela app.

Sempre tivemos muita curiosidade em trabalhar voz como uma interface. O caso da [integração] Alexa surgiu porque temos objetivos alinhados. Na altura nem era um projeto comercial, fizemo-lo para nós porque o Blixt tinha um Echo em casa e queria controlá-lo à distância. Mas, às tantas, fomos a Seattle conhecer a equipa deles e vimos que tínhamos muito em comum: a ideia deles é que Alexa tenha uma presença real na sala e nós pensamos no Roger como uma plataforma em todo o lado.

Em que mais estão a trabalhar?

Obviamente estamos a trabalhar em wearables, devices sem ecrã, etc. À medida que vamos começar a ver mais e mais aplicações a ter interfaces de voz – na Alexa já se consegue, por exemplo, encomendar um Uber ou pizzas -, acreditamos que a voz vai ser a próxima grande plataforma. E isto vai ser incentivado pelos devices, baixa latência, reconhecimento de voz etc. e o Roger agarra nessas coisas todas. Temos a vantagem de não ter grande competição e neste momento estamos todos a tentar juntar tudo e promovê-las em conjunto.

O número de serviços é para continuar a crescer?

Sim, esta integração de diferentes serviços tem muito a ver com a plataforma de integrações IFTTT (If This Than That), o que quer dizer que os developers fazem integrações que nós nem sequer sabemos. Um utilizador, por exemplo, perguntou-me agora se podia aprovar uma aplicação que ele fez com uma integração com o Evernote. A minha vida tem passado por reuniões com developers e outras empresas e perceber como é que conseguimos transpor a tecnologia deles para voz.

É por aqui que vai passar o futuro da app?

Também. Neste momento ainda é um bocado ficção científica, especialmente em Portugal, porque não temos a experiência da Amazon Echo e por aí fora e, por isso, as pessoas ainda não entendem muito bem o conceito. Mas o que queremos fazer é voz como interface e isso quer dizer pessoas, tecnologia e tudo e mais alguma coisa. Não quer dizer que o Roger vá deixar de ser uma ferramenta para as pessoas falarem umas com as outras, vai é continuar a crescer e ser uma interface para tudo.

Crédito: Roger
Crédito: Roger

Hoje em dia assistimos a um grande crescimento de plataformas de messaging. Como é que o Roger se posiciona em relação ao Messenger, Whatsapp ou Twitter, por exemplo, que integram bots?

Neste caso, o Roger não é uma plataforma de mensagens é, intencionalmente, voz. Estamos numa altura em que a tecnologia de voz está a avançar muito: começamos a ter dispositivos que nem sequer têm touchscreen – só têm microfones e altifalantes – para situações como quando estamos no carro ou a Amazon Echo para quando estamos em casa. Há uma série de movimentos em relação à voz e é aí que estamos a navegar. Messaging já existe, acredito que ainda venha alguma coisa mais interessante, mas é um mercado saturado que não estamos interessados em competir. O nosso ainda é muito emergente, ainda é muito novo, mas acreditamos que com o passar do tempo vai começar a ser mais prevalente.

Em que ponto estamos em relação à adopção da tecnologia de voz?

Quando saiu o anúncio da Amazon Echo nos Estados Unidos toda a gente fez piada daquilo. Quando as coisas são novas é muito difícil assumir que vão ser interessantes. A equipa que fez o Google Glass obviamente que tinha muitas mais aspirações do que aquilo que acabou por acontecer, mas faz parte do processo, é preciso experimentar as coisas. Nos Estados Unidos, pelo grande crescimento da Alexa, as pessoas começaram a adaptar-se à ideia e a achar que há qualquer coisa de interessante e que esta [a voz] pode ser a grande plataforma. Em Silicon Valley, na Bay Area, fala-se muito que a Alexa parece o início da App Store, em que se começou a falar muito de apps. Ainda é muito novo, mas parece que estamos nessa fase.

Como é que descreves o impacto do Roger, que começou por se apresentar como uma app que permitia ao smartphone funcionar como walkie-talkie?

É um projeto que tem muito potencial e muito impacto na vida das pessoas. Houve coisas das quais não estávamos à espera e que foram acontecendo como, por exemplo, o facto de grande parte dos nossos utilizadores serem pessoas cegas ou invisuais. Não me passava pela cabeça como é que uma pessoa invisual usa um smartphone e comecei a ver o impacto que isso podia ter nessas pessoas, em pessoas mais velhas ou em miúdos que não andam a escrever mensagens hoje em dia.

Isto para além do valor de falar. No meu caso, que vivo longe da minha família e dos meus amigos, tem outro valor ouvires a pessoa e estares a falar em algo diferente de um formato em que estás a escrever, a editar e onde se perde o tom.

A ideia é criar um sentimento de proximidade…

Nós queremos que as pessoas falem como se estivessem na mesma sala, como se estivessem um à frente do outro. Daí o facto de, quando estamos a ter uma conversa, o Roger mostrar a meteorologia e o horário. [Pegou no telefone e exemplificou]. A Elin, a minha noiva, está em Nova Iorque e por isso dá para vermos que são lá são 15h51; há pouco estava chover e aparecia um símbolo que o indicava.

A ideia é trazer proximidade e também gerar conversa. É um conversation starter. Isto surgiu porque a minha mãe telefonava-me muitas vezes a perguntar como é que estava o tempo, mas o que queria realmente era ter motivo de conversa: saber se eu trouxe um casaco ou o que é que vou fazer no fim-de-semana, por exemplo. O que o Roger faz é trazer um pouco do mundo das outras pessoas até ti.

Falando agora mais numa componente de empreendedorismo, consideras que o teu background te facilitou a vida no desenvolvimento do Roger?

Claramente. Não gosto de dizer sorte, mas tive a perspicácia de me pôr no sítio certo, na altura certa e obviamente que isso ajudou muito: tenho as portas todas abertas, tenho acesso a muitas coisas que se calhar muita gente não consegue ter. Lutei muito para chegar a um ponto em que tinha esse acesso e claro que isso ajudou. Mas acabamos por ter outros problemas. Naquilo que estamos a fazer não há ninguém que possa dar muitos conselhos, é um pouco mais por experimentação e perseverança. Como qualquer empreendedor, dizemos que está sempre tudo a correr muito bem, mas, na nossa cabeça, tanto estamos a sentir-nos muito bem como a seguir pensas que vai ser o fim do mundo. Não é para toda a gente, tem de se ser algo masoquista para se ser empreendedor.

Que qualidades consideras ter e que são importantes neste meio?

A qualidade que eu tenho e acho que foi mais marcante na minha vida foi a curiosidade, o facto de conseguir sempre aprender em qualquer situação. Na semana passada, estive num evento em Los Angeles em que conheci uma série de empresas e o lutador de wrestling John Cena. Era capaz de ser a última pessoa na vida com quem ia achar que ia aprender alguma coisa e na verdade aprendi. Ele explicou que aquilo que faz no ringue é um produto, encenado tal como um filme, e acredita que é o melhor produto que existe ao nível do entretenimento.

Depois comecei a ver a paixão que ele tem em fazer aquilo para o público: tem uma ideia do produto e do que quer que seja, mas depois olha para o público e promove, por exemplo, determinada t-shirt, tendo em conta se no público estão mais famílias ou mais estudantes universitários, e vai adaptando a performance dele. É extremamente profissional e apaixonado por aquilo que faz. De certa forma, tirei lições disso para o Roger: não é o público que vai ditar o que vou fazer mas há uma maneira de tentar encontrar os dois.

Para um empreendedor é importante nunca perder a qualidade de ser curioso, de nunca achar que temos as soluções todas e que se pode aprender com qualquer pessoa que se encontra na rua, seja um sem-abrigo, seja o Mark Zuckerberg.

Há mais alguma coisa que te inspire?

O punk hardcore, por exemplo, foi algo que me influenciou. É bizarro, se calhar não é algo onde as pessoas achem que vão buscar inspiração mas de alguma forma tirei daí coisas que me ajudaram ao longo da vida. O que comecei a aprender é que, ao fim e ao cabo, há mais de uma maneira de suceder na vida e de ir atrás dos sonhos e por isso é que temos de manter os olhos abertos, ser algo ingénuos e ir atrás das coisas.

Foste considerado uma das 100 personalidades mais criativas do mundo pela Fast Company. Como é que vês isso?

É uma boa pergunta. Tradicionalmente, sou um bocado adverso a essas distinções, mas de certa forma fiquei extremamente feliz pelo reconhecimento do trabalho que estamos a fazer. Neste caso é algo que tem o meu nome, mas acho que é um bocado absurdo porque não tinha chegado aqui especialmente sem o meu cofundador e o resto da equipa.

Por outro lado, também me deu a oportunidade de expor e falar sobre o meu trabalho num evento do Fast Company. Aquilo que estamos a fazer é tão difícil – essencialmente estamos a convencer as pessoas a falar outra vez, a não passarem tanto tempo a escrever mensagens de texto – que sabe bem poder estar num pódio a falar daquilo que estamos a tentar fazer.