#SystemReliability

2026-01-27

Một số lỗi thực tế trên môi trường sản xuất không gây sập hệ thống hay hiện lỗi rõ ràng, nhưng lại dẫn đến trạng thái sai lệch: người dùng bị chặn, giao dịch không thực hiện, webhook không gửi được... Dữ liệu "im lặng" lệch hướng trong khi mọi thứ vẫn hiển thị bình thường. Những lỗi này ẩn mình trong glue code, sự chênh lệch môi trường, cạnh thời gian xử lý hoặc các luồng dự phòng bị lãng quên. Có phải sản phẩm thực sự "ma ám"? 🤯 #SoftwareEngineering #SystemReliability #Debugging #SRE #LỗiẨn #K

[소프트웨어 엔지니어링의 미래는 SRE다

소프트웨어 엔지니어링의 미래는 서비스 운영 역량에 있는 SRE(사이트 신뢰성 엔지니어링)에 집중될 전망입니다. 코드 작성은 쉬워졌지만, 시스템의 안정적 운영과 유지보수는 여전히 복잡하며, SRE는 이러한 요구를 충족시키기 위한 핵심 역할로 부상하고 있습니다.

news.hada.io/topic?id=26134

#sre #softwareengineering #operationalexcellence #nocode #systemreliability

2025-12-18

Trong hệ thống phân tán, ngay cả một tỷ lệ gián đoạn nhỏ như 1% cũng có thể dẫn đến khả năng suy giảm cao. Ví dụ: 50 nút mỗi nút 1% thì mỗi lần gọi có 40% khả năng suy giảm. #hethongphantan #tindunghe #distributedsystems #systemreliability

reddit.com/r/programming/comme

2024-11-21

Is your monitoring full of noisy alerts or missing key issues? Learn how to fix these monitoring smells and keep your systems reliable!

#devops
#sre
#monitoring
#SystemReliability

blog.ugurelveren.com/post/iden

2024-03-20

Reliability is the backbone of user trust and system resilience. It's surprising to me how many development shops do not regularly discuss resiliency and reliability. #SystemReliability

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst