Close Menu
DigitalDrift

    Subscribe to Updates

    Get the latest creative news from FooBar about art, design and business.

    What's Hot

    Como escolher a lâmpada inteligente ideal para sua casa

    July 18, 2025

    Fechaduras eletrônicas: segurança moderna para sua residência

    July 16, 2025

    Os 10 melhores robôs aspiradores para deixar sua casa limpa sem esforço

    July 15, 2025
    Facebook X (Twitter) Instagram
    DigitalDriftDigitalDrift
    Tendências
    • Como escolher a lâmpada inteligente ideal para sua casa
    • Fechaduras eletrônicas: segurança moderna para sua residência
    • Os 10 melhores robôs aspiradores para deixar sua casa limpa sem esforço
    • Qual LÂMPADA INTELIGENTE comprar em 2025? Guia 5 Melhores
    • DREAME M1 vs WAP W400: Comparativo Completo dos Robôs Aspiradores
    • As respostas de palavras cruzadas do NYT Mini de hoje para 7 de julho
    • 5 maneiras fáceis de evitar pagar US $ 139 pelo Amazon Prime
    • Os pesquisadores procuram influenciar a revisão por pares com os avisos de IA ocultos
    Facebook X (Twitter) Instagram
    • 🏠 Início
    • Casa Inteligente
    • Cibersegurança
    • Computação em Nuvem
    • Gadgets e Lançamentos
    • Inteligência Artificial
    • Tendências
    DigitalDrift
    Home»Inteligência Artificial»Sakana Ai’s TreeQuest: implante equipes multimodel que superam o LLMS individual em 30%
    Inteligência Artificial

    Sakana Ai’s TreeQuest: implante equipes multimodel que superam o LLMS individual em 30%

    Genildo F.By Genildo F.July 4, 2025No Comments7 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Sakana Ai's TreeQuest: implante equipes multimodel que superam o LLMS individual em 30%
    Different test-time scaling strategies Source: Sakana AI
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Quer insights mais inteligentes em sua caixa de entrada? Inscreva -se para que nossos boletins semanais obtenham apenas o que importa para a IA, dados e líderes de segurança corporativos. Inscreva -se agora

    Laboratório AI japonês Sakana ai Introduziu uma nova técnica que permite que vários modelos de idiomas grandes (LLMs) cooperem em uma única tarefa, criando efetivamente uma “equipe dos sonhos” de agentes de IA. O método, chamado Multi-LLM AB-MCTSpermite que os modelos realizem tentativas e erros e combinem seus pontos fortes exclusivos para resolver problemas que são complexos demais para qualquer modelo individual.

    Para as empresas, essa abordagem fornece um meio de desenvolver sistemas de IA mais robustos e capazes. Em vez de estar preso a um único provedor ou modelo, as empresas poderiam aproveitar dinamicamente os melhores aspectos de diferentes modelos de fronteira, atribuindo a IA certa para a parte direita de uma tarefa para obter resultados superiores.

    O poder da inteligência coletiva

    Os modelos de AI de fronteira estão evoluindo rapidamente. No entanto, cada modelo possui seus próprios pontos fortes e fracos distintos derivados de seus dados e arquitetura de treinamento exclusivos. Um pode se destacar na codificação, enquanto outro se destaca na escrita criativa. Os pesquisadores de Sakana AI argumentam que essas diferenças não são um bug, mas um recurso.

    “Vemos esses preconceitos e aptidões variadas não como limitações, mas como recursos preciosos para criar inteligência coletiva”, afirmam os pesquisadores em seus Postagem do blog. Eles acreditam que, assim como as maiores conquistas da humanidade vêm de diversas equipes, os sistemas de IA também podem conseguir mais trabalhando juntos. “Ao reunir sua inteligência, os sistemas de IA podem resolver problemas que são intransponíveis para qualquer modelo único”.

    Pensando mais no tempo de inferência

    O novo algoritmo de Sakana AI é uma técnica de “escala de tempo de inferência” (também chamada de “escala de tempo de teste”), uma área de pesquisa que se tornou muito popular no ano passado. Embora a maior parte do foco na IA tenha sido o “escala em tempo de treinamento” (aumentando os modelos e treinando-os em conjuntos de dados maiores), o escala de tempo de inferência melhora o desempenho, alocando mais recursos computacionais depois que um modelo já é treinado.

    Uma abordagem comum envolve o uso de aprendizado de reforço para levar os modelos a gerar sequências mais detalhadas e mais detalhadas de cadeia de pensamento (COT), como visto em modelos populares como OpenAi O3 e Deepseek-R1. Outro método mais simples é a amostragem repetida, onde o modelo recebe o mesmo prompt várias vezes para gerar uma variedade de soluções em potencial, semelhante a uma sessão de brainstorming. O trabalho de Sakana AI combina e avança essas idéias.

    “Nossa estrutura oferece uma versão mais inteligente e estratégica do Best of-N (também conhecido como amostragem repetida)”, disse Takuya Akiba, cientista de pesquisa da Sakana AI e co-autor do artigo, VentureBeat. “Ele complementa técnicas de raciocínio, como o Long Cot, através da seleção dinâmica da estratégia de pesquisa e do LLM apropriado, essa abordagem maximiza o desempenho dentro de um número limitado de chamadas de LLM, fornecendo melhores resultados em tarefas complexas”.

    Como funciona a pesquisa de ramificação adaptativa

    O núcleo do novo método é um algoritmo chamado Adaptive Ramiling Monte Carlo Tree Search (AB-MCTS). Ele permite que um LLM execute efetivamente o desempenho e o erro, equilibrando inteligentemente duas estratégias de pesquisa diferentes: “pesquisando profundamente” e “pesquisando mais amplo”. A pesquisa mais profunda envolve uma resposta promissora e refiná -la repetidamente, enquanto pesquisar mais amplo significa gerar soluções completamente novas a partir do zero. O AB-MCTS combina essas abordagens, permitindo que o sistema melhore uma boa idéia, mas também gire e tente algo novo se atingir um beco sem saída ou descobrir outra direção promissora.

    Para conseguir isso, o sistema usa Pesquisa de árvore de Monte Carlo (MCTS), um algoritmo de tomada de decisão usado famosamente pelo Alphago de DeepMind. A cada etapa, o AB-MCTS usa modelos de probabilidade para decidir se é mais estratégico refinar uma solução existente ou gerar uma nova.

    Diferentes estratégias de escala de tempo de teste Fonte: Sakana AI

    Os pesquisadores deram um passo adiante com o AB-MCTS multi-llm, que não apenas decide “o que” fazer (refinar versus gerar), mas também “qual” o LLM deve fazê-lo. No início de uma tarefa, o sistema não sabe qual modelo é mais adequado para o problema. Começa tentando uma mistura equilibrada de LLMs disponíveis e, à medida que progride, aprende quais modelos são mais eficazes, alocando mais da carga de trabalho para eles ao longo do tempo.

    Colocando a IA ‘time de sonho’ à prova

    Os pesquisadores testaram seu sistema AB-MCTS multi-llm no Benchmark Arc-Agi-2. O ARC (abstração e corpus de raciocínio) foi projetado para testar uma capacidade humana de resolver novos problemas de raciocínio visual, tornando-o notoriamente difícil para a IA.

    A equipe usou uma combinação de modelos de fronteira, incluindo O4-mini, Gemini 2.5 Pro e Deepseek-R1.

    O coletivo dos modelos foi capaz de encontrar soluções corretas para mais de 30% dos 120 problemas de teste, uma pontuação que superou significativamente qualquer um dos modelos que trabalham sozinho. O sistema demonstrou a capacidade de atribuir dinamicamente o melhor modelo para um determinado problema. Em tarefas em que existia um caminho claro para uma solução, o algoritmo identificou rapidamente o LLM mais eficaz e o usou com mais frequência.

    AB-MCTS vs Modelos Individuais Fonte: Sakana AI

    Mais impressionantemente, a equipe observou casos em que os modelos resolveram problemas que antes eram impossíveis para qualquer um deles. Em um caso, uma solução gerada pelo modelo O4-mini estava incorreta. No entanto, o sistema passou por essa tentativa defeituosa do Deepseek-R1 e Gemini-2.5 Pro, que foi capaz de analisar o erro, corrigi-lo e, finalmente, produzir a resposta certa.

    “Isso demonstra que o AB-MCTS multi-LLM pode combinar flexibilidade modelos de fronteira para resolver problemas anteriormente insolúveis, empurrando os limites do que é alcançável usando o LLMS como uma inteligência coletiva”, escrevem os pesquisadores.

    O AB-MTCS pode selecionar diferentes modelos em diferentes estágios de resolução de uma fonte de problema: Sakana AI

    “Além dos prós e contras individuais de cada modelo, a tendência de alucinar pode variar significativamente entre eles”, disse Akiba. “Ao criar um conjunto com um modelo com menos probabilidade de alucinar, pode ser possível alcançar o melhor dos dois mundos: poderosos recursos lógicos e forte fundamentação. Como a alucinação é uma questão importante em um contexto comercial, essa abordagem pode ser valiosa para sua mitigação.”

    De pesquisa a aplicações do mundo real

    Para ajudar desenvolvedores e empresas a aplicar esta técnica, a Sakana AI lançou o algoritmo subjacente como uma estrutura de código aberto chamado TreeQuestdisponível sob uma licença Apache 2.0 (utilizável para fins comerciais). A TreeQuest fornece uma API flexível, permitindo que os usuários implementem o AB-MCTS Multi-LLM para suas próprias tarefas com pontuação e lógica personalizadas.

    “Enquanto estamos nos estágios iniciais da aplicação do AB-MCTS a problemas específicos orientados para os negócios, nossa pesquisa revela um potencial significativo em várias áreas”, disse Akiba.

    Além da referência Arc-Agi-2, a equipe conseguiu aplicar com sucesso o AB-MCTS a tarefas como codificação algorítmica complexa e melhorar a precisão dos modelos de aprendizado de máquina.

    “O AB-MCTS também pode ser altamente eficaz para problemas que exigem tentativa e erro iterativos, como otimizar as métricas de desempenho do software existente”, disse Akiba. “Por exemplo, pode ser usado para encontrar automaticamente maneiras de melhorar a latência de resposta de um serviço da Web”.

    O lançamento de uma ferramenta prática e de código aberto pode abrir caminho para uma nova classe de aplicativos de IA corporativos mais poderosos e confiáveis.

    Insights diários sobre casos de uso de negócios com VB diariamente

    Se você deseja impressionar seu chefe, o VB Daily o cobriu. Damos a você uma informação interna sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias a implantações práticas, para que você possa compartilhar informações para o ROI máximo.

    Leia nossa Política de Privacidade

    Obrigado por assinar. Confira mais boletins de VB aqui.

    Ocorreu um erro.

    Related

    Ais equipes implante individual LLMS multimodel Sakana superam TreeQuest
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleCrunchyroll culpa o fornecedor de terceiros pela bagunça da legenda da AI
    Next Article Confirmamos que o Dock de TV da Nintendo Switch 2 suporta VRR – então, por que não funciona com o Switch 2?
    Genildo F.
    • Website

    Genildo Ferreira | Especialista em TI e Telecom | Transformação Digital. Lidero projetos avançados de comunicação de dados, com expertise em redes DWDM, Metro Ethernet, IP, automação e DevOps. No DigitalDrift, compartilho análises técnicas sobre conectividade, smart homes e o futuro da tecnologia integrada.

    Related Posts

    Inteligência Artificial

    Os pesquisadores procuram influenciar a revisão por pares com os avisos de IA ocultos

    July 7, 2025
    Inteligência Artificial

    Dream ao vivo dos EUA vs. México: como assistir Copa de Ouro da CONCACAF 2025 Futebol final de qualquer lugar

    July 6, 2025
    Inteligência Artificial

    O plugue inteligente da Amazon cai para apenas US $ 13 para o dia do primo

    July 6, 2025
    Add A Comment

    Leave a ReplyCancel reply

    Principais Postagens

    As respostas de palavras cruzadas do NYT Mini de hoje para 7 de julho

    July 7, 202527 Views

    Principais Estratégias de Marketing Digital para Iniciantes em 2025

    July 4, 202527 Views

    Ferramentas Essenciais de Marketing Digital para Quem Está Começando

    July 4, 202525 Views
    Fique em Contato
    • Facebook
    • YouTube
    • TikTok
    • WhatsApp
    • Twitter
    • Instagram
    Últimas Avaliações
    Inteligência Artificial

    As previsões de emprego da IA ​​tornam -se o mais novo esporte competitivo da América da América

    Genildo F.July 3, 2025
    Inteligência Artificial

    Os chatbots de gêmeos personalizáveis ​​do Google estão agora em documentos, folhas e gmail

    Genildo F.July 3, 2025
    Tendências

    12 melhores assinaturas de café (2025), testadas e revisadas

    Genildo F.July 3, 2025
    Mais Populares

    Os melhores carregadores rápidos para 2025

    July 3, 20250 Views

    O melhor dia do Prime Day lida com airpods, iPads, MacBooks e muito mais

    July 3, 20250 Views

    Os CIOs vêem ai solicitando a contratação de TI novas, mesmo quando as placas pressionam por cortes de empregos

    July 3, 20250 Views
    Nossas Escolhas

    Como escolher a lâmpada inteligente ideal para sua casa

    July 18, 2025

    Fechaduras eletrônicas: segurança moderna para sua residência

    July 16, 2025

    Os 10 melhores robôs aspiradores para deixar sua casa limpa sem esforço

    July 15, 2025
    Postagens Recentes
    • Como escolher a lâmpada inteligente ideal para sua casa
    • Fechaduras eletrônicas: segurança moderna para sua residência
    • Os 10 melhores robôs aspiradores para deixar sua casa limpa sem esforço
    • Qual LÂMPADA INTELIGENTE comprar em 2025? Guia 5 Melhores
    • DREAME M1 vs WAP W400: Comparativo Completo dos Robôs Aspiradores
    Facebook X (Twitter) Instagram Pinterest
    • Sobre Nós
    • Fale Conosco
    • Aviso Legal
    • Política de Privacidade
    • Termos e Condições
    © 2025 DigitalDrift. Desenvolvido por DigitalDrift.

    Type above and press Enter to search. Press Esc to cancel.