"É um projeto que requer muita mão de obra", disse o analista de dados para a Radio France. "Trabalhei em um grande open space onde devia haver pelo menos 80 pessoas, com um novo lote de 10 a 20 funcionários chegando toda segunda-feira. No total, havia centenas de 'Siri graders' ou 'avaliadores de Siri' empregados na cidade", estima Le Bonniec.
"No mesmo dia em que cheguei, nos explicaram que iríamos trabalhar em gravações de pessoas falando com seu assistente Siri ou em gravações capturadas sem o conhecimento delas, quando a máquina era acionada por engano", continua o denunciante. "Isso consistia em verificar se as transcrições das conversas da Siri estavam corretas ou se precisavam ser corrigidas. Uma grande parte do nosso trabalho era principalmente identificar se eram gravações acidentais, 'accidental trigger' (gatilhos acidentais), no jargão da Apple."
O ex-empregado da empresa afirma que tinha uma obrigação de quantidade e de qualidade e que processava projetos de 1.300 registros por dia com um limite de precisão de pelo menos 90%.
Alguns empregados são responsáveis por etiquetar as palavras-chave ditas durante uma gravação e vinculá-las aos dados armazenados nos dispositivos dos usuários, como contatos, geolocalização, música, filmes, marcas, aos quais têm acesso. "Eles rotulam esses dados pessoais com palavras-chave. Para a gravação 'ligar para a mãe', por exemplo, meus colegas tiveram que procurar por 'mãe' nos contatos do dispositivo e rotulá-lo. Esse trabalho de marcação manual deveria melhorar o reconhecimento dos comandos usados pela Siri e acionar as ações apropriadas nos dispositivos, como ligar para o contato certo", explica.
Conversas íntimas
Durante o tempo que trabalhou na GTS, Thomas e seus colegas ouviram uma quantidade considerável de gravações acionadas por engano, onde os usuários falavam sobre suas vidas privadas sem saber que estavam sendo gravados.
"Há momentos banais, mas também chocantes ou embaraçosos em que você ouve coisas muito íntimas, até mesmo violentas, que você não compartilha com estranhos. Conversas em que dados de saúde são discutidos, como alguém falando sobre sua esclerose múltipla ou um aborto espontâneo. Você também ouve opiniões políticas ou sindicais. Muitas gravações de crianças em iPads. Me lembro de ouvir alguém falando sobre sua conta bancária na Suíça. Colegas ouviam regularmente casais tendo relações sexuais", afirma.
Foi justamente a denúncia de uma gravação de cunho sexual ao seu superior que convenceu Thomas Le Bonniec a deixar a empresa após ter ouvido quase 50.000 gravações. A experiência como Siri Grader o levou a quebrar sua cláusula de confidencialidade para denunciar o que ele considerava um "sistema de escuta generalizado" e, assim, se tornar um dos raros denunciantes dentro do GAFAM (Google, Apple, Facebook, Amazon, Microsoft).
"As pessoas compram produtos Apple pensando que sua privacidade está mais protegida. Não estou nada convencido", diz.
Segundo Le Bonniec, Google, Microsoft e Amazon também contrataram pessoas para fazer o mesmo tipo de trabalho sobre seus assistentes de voz. Para ele, são necessárias investigações aprofundadas para determinar qual é o interesse das empresas por trás da prática e se eles violaram a lei.
Mas desde 2020, as denúncias de Thomas Le Bonniec às agências de proteção de dados francesas ou europeias não desencadearam nenhuma investigação. A Comissão de Proteção de Dados da Irlanda encerrou seu relatório em 2022 sem iniciar uma investigação.
"O reclamante não apresentou nenhuma evidência de processamento irregular de seus dados pessoais", explicou a comissão à Rádio França. Em agosto de 2019, após o depoimento de Thomas Le Bonniec e vários outros funcionários do projeto Crowd Collect, a Apple anunciou que estava suspendendo seu programa de melhoria da Siri. A empresa afirmou, na época, que apenas 0,2% das solicitações da Siri e suas transcrições foram processadas e armazenadas.
Segundo a Apple, os dados processados pela Siri não permitem a identificação dos usuários, já que cada dispositivo gera um identificador alfanumérico único e anônimo.
Questionada pela Radio France, a Apple afirmou que Siri foi projetada para proteger a privacidade do usuário. "Usamos dados da Siri para melhorar a Siri e estamos constantemente desenvolvendo tecnologias para torná-la ainda mais privada. A Apple resolveu este caso para evitar litígios adicionais e seguir em frente. Os dados da Siri nunca foram usados para criar perfis de marketing e nunca foram vendidos a ninguém para nenhuma finalidade", afirma.
Dados usados para fins publicitários
Mas estes argumentos não convencem todos os clientes da Apple. Muitos acreditam que suas discussões privadas estão sendo capturadas por seus iPhones para fins publicitários.
Siri é acionado, em princípio, com o comando em português "E aí, Siri", ou "Siri", quando a escuta começa.
Este material é potencialmente enviado aos servidores onde o reconhecimento é feito. "Na minha opinião, nem tudo é registrado e preservado. Isso é impossível dada a grande quantidade de solicitações. Mas quando a transcrição recebe uma nota ruim, queremos saber por que a Siri não a reconheceu corretamente. E aí, de fato, pode haver agentes que vão ouvir isso e tentar encontrar o problema com a compreensão da frase", afirma Luc Julia, engenheiro francês que participou da criação do aplicativo.
Ele afirma que esse trabalho para melhorar Siri não tem o objetivo de criar perfis de publicidade para clientes da Apple. "A Apple estaria dando um tiro no próprio pé se descobrissem que esses dados são usados para qualquer outra coisa que não seja melhorar o serviço, conforme explicado nas condições gerais de uso", explica o engenheiro. "Não sou completamente ingênuo. Obviamente, se quiséssemos fazer isso, poderíamos, mas não acho que seja ideia da Apple definir perfis de usuários", afirma.
A denúncia contra a Apple na França acontece pouco antes dos tribunais da Califórnia decidirem, nesta sexta-feira (14), sobre a ação coletiva "Lopez vs Apple", movida por usuários americanos que acusam a empresa de ter gravado, processado e armazenado suas conversas privadas sem seu consentimento, entre 2014 e 2024. Esses dados estariam sendo usados para fins comerciais, e não apenas para melhorar o desempenho do assistente Siri e da função Ditado integrada aos dispositivos da empresa.
A Apple sempre negou as acusações. No entanto, a empresa se prepara para abrir um fundo de compensação de U$ 95 milhões para evitar novos processos contra ela nos Estados Unidos. Se validado pelos tribunais da Califórnia, o acordo amigável prevê que proprietários americanos de iPhones, iPads, Apple Watches, MacBooks, iMacs, HomePods, iPod Touch ou AppleTVs poderão ser indenizados com um valor de U$ 20 (R$ 114,52) por dispositivo.