#lstm

2025-06-06

Continuous Thought Machine: как Sakana AI научила модель думать тиками

Аналитический центр red_mad_robot продолжает следить за архитектурными прорывами в мире AI. В этот раз — экспериментальная модель от команды Sakana AI , которая предлагает мыслить не в терминах слоёв, а в терминах времени. Их Continuous Thought Machine (CTM) — попытка встроить в нейросеть внутреннюю динамику, вдохновлённую человеческим мозгом. Разбираем, как устроена архитектура, что такое «внутренние тики» и зачем нейросети синхронизировать собственные мысли — на примерах из CV, сортировки, Q&A и RL.

habr.com/ru/companies/redmadro

#ai #sakana #ctm #ml #lstm #sakanaai #architecture #cifar10 #nlm

2025-05-28

Анализ и прогнозирование погодных условий

Настоящее исследование посвящено комплексному анализу глобальных климатических изменений на основе исторических метеорологических данных за период с 1950 по 2024 год. Мы фокусируемся на шести ключевых странах, представляющих основные климатические зоны планеты.

habr.com/ru/articles/913712/

#Прогнозирование_погоды #Meteostat #postgresql #lstm #xgboost

2025-05-20

If #AI were a historical timeline, #RNN and #LSTM were the early trailblazers—laying the foundation for the rise of #GPT and #BERT, the transformers that reshaped how machines understand and generate human language.

Olusegun OyekanmiOluOyekanmi@flipboard.com
2025-04-28

Multimodal Stock Price Prediction https://youtu.be/cxHjX4xjvhw?feature=shared via @YouTube #chatgpt #financialforecasting #stockmarket #deeplearning #finbert #lstm

youtube.com/watch?v=cxHjX4xjvh

Posted into NOSACAPITALISTA @nosacapitalista-OluOyekanmi

2025-04-09

UEBA в кибербезе: как профилирование поведения пользователей на основе Autoencoder помогает выявлять угрозы и аномалии

В современном мире количество атак растёт пропорционально количеству внедрений новых технологий, особенно когда технологии ещё недостаточно изучены. В последнее время атаки становятся всё более разнообразными, а методы их реализации — всё более изощрёнными. Дополнительные проблемы несут и методы искусственного интеллекта, которыми вооружаются специалисты RedTeam. В руках опытного специалиста эти инструменты становятся реальной угрозой безопасности потенциальных целей. Большинство средств информационной безопасности основаны на корреляционных или статистических методах, которые в современных реалиях часто оказываются неэффективными. Что же тогда остаётся специалистам BlueTeam?

habr.com/ru/companies/gaz-is/a

#газинформсервис #информационная_безопасность #ueba #поведенческая_аналитика #lstm #autoencoder #falco

Olusegun OyekanmiOluOyekanmi@flipboard.com
2025-03-30

A Hierarchical conv-LSTM and LLM Integrated Model for Holistic Stock For... https://youtu.be/G-MLSchOaCo?feature=shared via @YouTube #neuralnetworks #stockmarketpredictions #llm #lstm #cnn

youtube.com/watch?v=G-MLSchOaC

Posted into AIOLOGY @aiology-OluOyekanmi

2025-02-26

Первая ИИ-модель для обучения на тексте

Привет, будущие разработчики! Сегодня я расскажу вам, как создать свою первую модель искусственного интеллекта. Это материал совсем для начинающих, так что не переживайте — никаких сложных терминов и запутанных выражений. Всё, что понадобится, — ваши идеи и немного кода. Будем писать на Python и использовать TensorFlow — мощную библиотеку от Google для машинного обучения.

habr.com/ru/companies/otus/art

#python #ИИ #tensorflow #машинное_обучение #ИИ_модель #lstm

Alauddin Maulana Hirzan 💻maulanahirzan@bsd.cafe
2024-12-28

Training 5 different LSTM models with Python3, PyTorch, and FreeBSD. I turned off X to reclaim more resources during model training. Since I did not know how to screen capture in CLI mode, let's settle with phone's camera. #LSTM #FreeBSD #NeuralNetwork

2024-11-10

Сердце насоса склонно к износу: предиктивная аналитика как гарант надёжности оборудования

Износ, старение и простои насосного оборудования создают серьёзные проблемы для многих предприятий, влияя на производительность и увеличивая затраты. В этой статье мы расскажем о нашем опыте использования предиктивного анализа на основе нейросетей LSTM для прогнозирования состояния насосов. Узнать об опыте

habr.com/ru/articles/857442/

#прогнозирование_временных_рядов #анализ_данных #машинное_обучение #автоматизация_производства #lstm #техническое_обслуживание #насосное_оборудование #предсказательная_аналитика #цифровизация_ТОиР #SAFE_PLANT

2024-10-29

'MLRegTest: A Benchmark for the Machine Learning of Regular Languages', by Sam van der Poel et al.

jmlr.org/papers/v25/23-0518.ht

#lstm #mlregtest #rnn

卡拉今天看了什麼ai_workspace@social.mikala.one
2024-10-18

憒�雿���曉�唳�踵��銝箔��隞���箔�����������蝛嗡��銝�嚗� - @Thoughts Memo | FxZhihu

Link
📌 Summary:
這篇文章探討了基於隨機最短路徑算法的間隔重複調度優化,文中提到了使用LSTM(長短期記憶網絡)模型來提高信息記憶效率。此外,還討論了不同的記憶技術、工具及其相互作用,強調數據分析技巧在儲存和回憶信息中的重要性。文檔舉例說明了如何透過先進的計算技術來改進學習效果,並提供了實際案例及參考資料,展示這些技術在教學和學習中的應用潛力。

🎯 Key Points:
- 探討間隔重複調度的最佳化方法。
- 提及LSTM模型在信息記憶中的應用。
- 討論不同記憶技術的交互作用與效果。
- 強調數據分析在學習過程中的重要角色。
- 實例和參考資料增強了論述的說服力。

🔖 Keywords:
#學習 #間隔重複 #LSTM #數據分析 #記憶技術

2024-10-16

Продолжение исследования RNN

С прошлой статьи я внёс несколько изменений: 1. Планировщик был сломан и не изменял скорость. Починил. 2. Остаточное соединение через умножение. 3. WindowedDense для выходной проекции. 4. Добавил clipnorm 1, cutoff_rate 0.4 Как обычно это всё добавляет стабильности и 1% точности. WindowedDense по неизвестной мне причине добавляет SMR стабильность.

habr.com/ru/articles/851182/

#rnn #lstm #gru #slr #smr #msmr #tensorflow #python #transformer #исследование

2024-10-05

Рекурретные нейронные сети наносят ответный удар

Рекуррентные нейронные сети (RNN), а также ее наследники такие, как LSTM и GRU, когда-то были основными инструментами для работы с последовательными данными. Однако в последние годы они были почти полностью вытеснены трансформерами (восхождение Attention is all you need ), которые стали доминировать в областях от обработки естественного языка до компьютерного зрения. В статье " Were RNNs All We Needed ?" авторы пересматривают потенциал RNN, адаптируя её под параллельные вычисления. Рассмотрим детальнее, в чем же они добились успеха.

habr.com/ru/articles/848480/

#рекуррентные_нейронные_сети #lstm #gru #трансформеры

2024-07-22

HIRING: Machine Learning Engineer, Web Ads and Open-loop E-Commerce -USDS / Mountain View
💰 USD 228K+

👉 ai-jobs.net/J354613/

#Architecture #ComputerScience #DeepLearning #Ecommerce #Engineering #Linux #LSTM #MachineLearning #MLmodels #MXNet

2024-05-10

xLSTM is a combination of transformer technology and long-term memory. The result is an architecture that performs better in terms of performance and scalability than the transformers currently in use, the researchers write.

arxiv.org/abs/2405.04517

Michael Fauscettemfauscette@techhub.social
2024-05-10

The Inventor of LSTM Unveils New Architecture for LLMs to Replace Transformers
zurl.co/Y8Ua
#ai #genai #llm #lstm

kcnickersonkcnickerson
2024-05-09

Interesting if not ironic proof that OpenAI does not employ LSTM ;> @jason_koebler @openai @404mediaco 404media.co/openai-files-copyr

2024-05-09

Das war eine sehr unterhaltsame Recherche, bei der ich Sepp Hochreiter getroffen habe - ein Pionier des maschinellen Lernens, der mit seiner alten Idee (#lstm) jetzt OpenAi „vom Markt fegen“ will.

Ob dieser alte Algorithmus wirklich das Zeug dazu hat, große Sprachmodelle zu revolutionieren, kann ich schwer einschätzen. Was mir aber immer klarer wurde in letzter Zeit: Transformermodelle sind an ihrer Grenze. Von daher wird sich was bewegen müssen.

zeit.de/digital/2024-05/sepp-h

#chatGPT #openAi

Alex JimenezAlexJimenez@mas.to
2024-05-08

The Inventor of #LSTM Unveils New Architecture for #LLMs to Replace Transformers

One of the most important aspects of the xLSTM architecture is its flexible ratio of MLSTM and SLSTM blocks.

analyticsindiamag.com/the-inve

#AI

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst