Strata San Francisco, 2019: oportunidades e riscos

Strata San Francisco, 2019: oportunidades e riscos


Equilibrar o risco e a recompensa é uma tensão necessária que precisaremos entender à medida que continuamos nossa jornada para a era dos dados.

A Strata Data Conference em São Francisco estava cheia de palestrantes falando sobre oportunidade. Mas essas oportunidades foram equilibradas com os riscos – riscos que surgem à medida que descobrimos maneiras mais poderosas de aplicar dados usando aprendizado de máquina e inteligência artificial. É uma tensão necessária que precisaremos entender à medida que continuamos a jornada até a era dos dados.

A fusão da Cloudera com a HortonWorks demonstra algumas das oportunidades. Eles "bebiam seu próprio champanhe" (uma metáfora preferível ao consumo de comida de cachorro) usando o aprendizado de máquina para fundir as duas empresas: agrupar clientes semelhantes, prever oportunidades de vendas e integrar as duas equipes.

Em sua palestra, o co-presidente do programa, Ben Lorica, deu excelentes conselhos para organizações que estão apenas iniciando o caminho para o aprendizado de máquina: empresas que tiveram sucesso com aprendizado de máquina ou construíram produtos ou serviços de dados existentes ou usaram aprendizado de máquina para modernizar aplicações existentes. Empresas que tentam dar um salto no vazio, trabalhando com dados e serviços que não entendem bem, terão um tempo difícil. Aprendizado de máquina cresce a partir de suas práticas de dados atuais. Pode ser revolucionário, mas se você não se preparar para a revolução desenvolvendo suas fontes de dados, aprendendo como limpar seus dados, preparando-se para a governança de dados e muito mais, inevitavelmente ficará para trás. Felizmente, existem ferramentas – tanto de código aberto quanto comerciais – para ajudar em todas essas áreas.

Algumas das oportunidades mais importantes são para democratizar os dados: não apenas tornar os dados acessíveis, mas torná-los utilizáveis ​​por todos na organização, mesmo aqueles sem habilidades de programação. A sessão de Jeremy Howard mostrou como um especialista em assunto sem conhecimento prévio de programação pode fazer uma aplicação de IA. Howard me contou sobre um dermatologista que criou um aplicativo que classifica as queimaduras. (Ele também recomendou não assistir a demonstração antes do almoço.) Esforços como esse são fundamentais para construir sistemas de IA que criem um mundo melhor. Os profissionais de emergência precisam de ferramentas que os auxiliem no campo, ferramentas que possam ser incorporadas em seus telefones e que tomem decisões sem esperar por um MD.

De acordo com Mike Olson, a coisa mais importante que aprendemos com a computação em nuvem é que "o fácil é realmente importante". Fácil não significa apenas que você pode pagar por computação com seu cartão de crédito ou adicionar e subtrair servidores a qualquer momento. E isso não significa apenas fornecer boas ferramentas para análise. Fácil se aplica a todos os aspectos da computação, particularmente dados de autoatendimento. Fácil significa criar ferramentas para construir pipelines de dados que não se importam onde os dados estão localizados fisicamente (em um datacenter ou na nuvem) e que entendem os regulamentos que governam esses dados e como eles são usados ​​e que tornam os dados acessíveis sem exigir programação Habilidades. Essas são ferramentas que podem ser usadas por qualquer pessoa, não apenas por engenheiros e analistas de dados: gerentes, executivos e pessoal de vendas e marketing.

Mover dados e computação para a nuvem continua sendo uma tremenda oportunidade. Ainda estamos nos primórdios da computação em nuvem: muitas empresas que poderiam transferir seus dados para a nuvem ainda não o fizeram. Jordan Tigani, do Google, falou sobre as muitas oportunidades que a nuvem representa, começando com o desacoplamento do armazenamento de dados da computação, reduzindo a sobrecarga administrativa, criando pipelines em tempo real, eliminando silos e permitindo o acesso de todos os usuários. Todos esses benefícios fluem naturalmente da movimentação de dados para a nuvem e dependem da escala de infraestrutura que apenas os provedores de nuvem oferecem.

E os riscos? Vários oradores, incluindo Peter Singer e David Sanger, falaram sobre os perigos de uma rede cada vez mais militarizada. Peter Singer disse: "Não há bala de prata. Continuarão a ser marketing, política, guerras, todas acontecendo online. Precisamos de novas estratégias para lidar com isso". Esses perigos aumentam à medida que nossas ferramentas se tornam mais poderosas; Singer disse que podemos esperar por "caras profundas" (vídeos falsos), e Elizabeth Svoboda discutiu como a neurociência já é usada para construir mensagens políticas que desencadeiam reações de medo.

Também ouvimos sobre o progresso para enfrentar esses desafios. Shafi Goldwasser desafiou os desenvolvedores a criar "Safe ML": aprendizado de máquina que não pode ser abusado. O aprendizado de máquina precisa garantir a privacidade, tanto dos dados de treinamento quanto do modelo, e precisa ser justo e invulnerável à adulteração. As ferramentas de que precisamos para criar o ML Seguro têm estado em desenvolvimento entre os criptógrafos nos últimos 30 anos, muito antes de o aprendizado de máquina moderno se tornar prático. O desafio enfrentado pelos desenvolvedores de aprendizado de máquina é usar essas ferramentas – aprendizado federado, criptografia multipartidária, criptografia homomórfica e privacidade diferencial – e colocá-las em uso. Seus pontos foram repetidos em várias outras sessões durante a conferência.

Na cúpula de ética, os participantes discutiram os muitos problemas na construção ética de sistemas de software. Há claramente perigos aqui: dificilmente passa um dia sem notícias de abuso de dados. Mas talvez a discussão mais interessante tenha sido se a ética é um jogo de soma zero ou uma oportunidade de negócio. Tratar os clientes de forma justa e respeitando sua individualidade e sua privacidade representa uma oportunidade? Há muitas coisas que você pode dizer sobre as práticas de negócios da Amazon, mas quase ninguém critica a facilidade com a qual você pode devolver mercadorias. Quais outras oportunidades existem? Muitos clientes se tornaram cínicos e esperam ser maltratados; Poucas empresas pensaram seriamente em usar dados para melhorar a vida de seus clientes. Isso pode estar mudando.

Esses temas foram ecoados na trilha do Futuro da Empresa, que se concentrou em repensar a corporação para a era digital. O futuro não é apenas "implementar a IA", mas criar organizações que funcionem melhor: que ofereçam suporte às necessidades de treinamento de seus funcionários, que escutem seus funcionários em questões éticas, que adotem uma abordagem centrada no ser humano. O futuro da empresa é aproveitar os dados, mas é sobre aproveitar os dados para criar um futuro melhor para clientes, funcionários e investidores.

Colocar dados para funcionar é uma oportunidade; nós temos feito esse ponto desde a primeira conferência do Strata. Os riscos de uma rede hostil e militarizada são reais. Mas as oportunidades – para corporações, funcionários, clientes – são muito maiores.

Continue lendo Strata San Francisco, 2019: Oportunidades e riscos.