#blas

Christos ArgyropoulosChristosArgyrop@mast.hpc.social
2026-03-08

Partial #performance comparison of #blas / #lapack in #rstats using Xeon E5-2697, i3-12100t, Ultra 7, 265, i7-11000 . The old timer still punches well for its age. Interesting to watch the less than gracious degradation in the AVX512 capable chip (i7)

Christos Argyropoulos MD PhDChristosArgyrop
2026-03-06

The plot thickens
(When one is about to rip through 10s of millions of medical records, one must profile the tools if the project is to finish before one's retirement)
FlexiBLAS makes this benchmarks a breeze

Christos Argyropoulos MD, PhD, FASN 🇺🇸 0kale/accchristosargyrop.bsky.social@bsky.brid.gy
2026-03-06

The plot thickens #BLAS #rstats #lapack (When one is about to rip through 10s of millions of medical records, one must profile the tools if the project is to finish before one's retirement) FlexiBLAS makes this benchmarks a breeze

Christos Argyropoulos MD, PhDChristosArgyrop@mstdn.science
2026-03-06

The plot thickens #BLAS #rstats #lapack
(When one is about to rip through 10s of millions of medical records, one must profile the tools if the project is to finish before one's retirement)
FlexiBLAS makes this benchmarks a breeze

Christos Argyropoulos MD, PhD, FASN 🇺🇸 0kale/accchristosargyrop.bsky.social@bsky.brid.gy
2026-03-06

I wonder if the #lapack that comes with #AOCL is being picked up by flexiblas in #rstats. The things I have to do for the love of electronic health records analytics #bigdata #blas

Christos ArgyropoulosChristosArgyrop@mast.hpc.social
2026-03-06

The plot thickens #BLAS #rstats #lapack
(When one is about to rip through 10s of millions of medical records, one must profile the tools if the project is to finish before one's retirement)
FlexiBLAS makes this benchmarks a breeze

Christos Argyropoulos MD PhDChristosArgyrop
2026-03-06

I wonder if the that comes with is being picked up by flexiblas in .
The things I have to do for the love of electronic health records analytics

Christos ArgyropoulosChristosArgyrop@mast.hpc.social
2026-03-06

I wonder if the #lapack that comes with #AOCL is being picked up by flexiblas in #rstats.
The things I have to do for the love of electronic health records analytics #bigdata #blas

Christos Argyropoulos MD, PhDChristosArgyrop@mstdn.science
2026-03-05

I wonder if the #lapack that comes with #AOCL is being picked up by flexiblas in #rstats.
The things I have to do for the love of electronic health records analytics #bigdata #blas

Christos ArgyropoulosChristosArgyrop@mast.hpc.social
2026-03-04

Why am I just finding put now about #FLEXIBLE?#BLAS

2025-12-07

tritonBLAS: Triton-based Analytical Approach for GEMM Kernel Parameter Selection

#Triton #BLAS #GEMM #AMD #ROCm #HPC #Performance #Package

hgpu.org/?p=30441

Jesus Michał "Le Sigh" 🏔 (he)mgorny@treehouse.systems
2025-10-23

Another post on #Quansight PBC blog: "BLAS/LAPACK #packaging"

labs.quansight.org/blog/blas-l

"""
#BLAS and #LAPACK are the standard libraries for linear algebra. The original implementation, often called Netlib LAPACK, developed since the 1980s, nowadays serves primarily as the origin of the standard interface, the reference implementation and a conformance test suite. The end users usually use optimized implementations of the same interfaces. The choice ranges from generically tuned libraries such as OpenBLAS and BLIS, through libraries focused on specific hardware such as Intel® oneMKL, Arm Performance Libraries or the Accelerate framework on macOS, to ATLAS that aims to automatically optimize for a specific system.

The diversity of available libraries, developed in parallel with the standard interfaces, along with vendor-specific extensions and further downstream changes, adds quite a bit of complexity around using these libraries in software, and distributing such software afterwards. This problem entangles implementation authors, consumer software authors, build system maintainers and distribution maintainers. Software authors generally wish to distribute their packages built against a generically optimized BLAS/LAPACK implementation. Advanced users often wish to be able to use a different implementation, more suited to their particular needs. Distributions wish to be able to consistently build software against their system libraries, and ideally provide users the ability to switch between different implementations. Then, build systems need to provide the scaffolding for all of that.

I have recently taken up the work to provide such a scaffolding for the Meson build system; to add support for BLAS and LAPACK dependencies to Meson. While working on it, I had to learn a lot about BLAS/LAPACK packaging: not only how the different implementations differ from one another, but also what is changed by their respective downstream packaging. In this blog post, I would like to organize and share what I have learned.
"""

#CondaForge #Debian #Fedora #Gentoo

Jezus Michał "Le Wzdych" (on)mgorny@pol.social
2025-09-23

Wspominałem już może, że pracuję nad przejściem #Gentoo z na wpół zepsutego eselect-ldso dla #BLAS / #LAPACK, na #FlexiBLAS. Oznacza to również, że czeka nas okres przejściowy, w czasie którego obydwa rozwiązania będą wspierane.

Plus jest taki, że stan "po" jest kompatybilny pod względem ABI ze stanem "przed" (a przynajmniej powinien być — pracujemy z autorami, by poprawić ostatnie niedociągnięcia). Zastępujemy libblas.so, liblapack.so i inne biblitoteki dowiązaniami symbolicznymi, więc programy skompilowane przed zmianą po prostu zaczną używać FlexiBLAS.

Minus jest taki, że w drugą stronę nie jest tak łatwo. Po zastąpieniu biblitotek dowiązaniami, nowoskompilowane programy będą odczytywać SONAME z biblioteki docelowej, a więc zaczną się wiązać bezpośrednio z FlexiBLAS. Co za tym idzie, powrót do stanu poprzedniego będzie wymagał ich ponownej kompilacji.

Aby tego uniknąć, musielibyśmy zamiast dowiązań symbolicznych zastosować jakieś biblioteki pośredniczące, które miałyby "stare" SONAME, a korzystąły z funkcji FlexiBLAS. Niestety, nic prostego tu nie zadziała — musiałbym jakoś "wyeksportować" symbole z FlexiBLAS, i najlepiej podzielić je na odpowiednie biblioteki, żeby `-Wl,--as-needed` nic nie wycięło. Tylko jak to zrobić?

Cóż, eselect-ldso tworzy jakieś biblioteki, więc może uda się coś wykorzystać. No i szukam w źródłach, i nic nie mogę znaleźć. W końcu do mnie dociera, że cała logika dodana jest przez łatki Gentoo. A te łatki są po prostu paskudne. W OpenBLAS tworzymy dodatkowe biblioteki libblas.so, itp., które zawierają kopie obiektów z OpenBLAS i wiążą się z libopenblas, żeby pobrać brakujące zależności. Nawet nie wiążą się jedna z drugą, więc każda duplikuje sporo kodu niezależnie. Łatki dla BLIS są jeszcze gorsze — tu libblas.so i libcblas.so to praktycznie kopie libblis.so, z poszczególnymi "niepotrzebnymi" symbolami ukrytymi przy pomocy "visibility".

No cóż, można się było tego spodziewać po projekcie z #GSoC.

2025-09-14

High Performance Matrix Multiplication

#CUDA #OpenMP #BLAS #Performance #Package

hgpu.org/?p=30188

Jezus Michał "Le Wzdych" (on)mgorny@pol.social
2025-09-14

1. Zdobądź trochę wiedzy o paczkach #BLAS / #LAPACK w ramach bejmopracy.
2. Odkryj, że paczki #MKL w #Gentoo są mocno nieaktualne i ciut zepsute. Przejmij je, zaktualizuj, ulepsz.
3. Zainteresuj się #FlexiBLAS. Zacznij eksperymentować. Wrzuć paczkę do Gentoo.
4. Odkryj, że mechanizm dynamicznego przełączania BLAS / LAPACK niezbyt dobrze działa. Zaproponuj migrację do FlexiBLAS i przygotuj próbne zmiany.
5. Zauważ niespójności we wsparciu ILP64. Zaproponuj poprawki.
6. Odkryj, że wszystkie paczki BLAS / LAPACK w Gentoo są praktycznie bez opiekuna.

No więc wygląda na to, że jestem nowym opiekunem całego kompletu. Pracuję nad poprawkamj dla ILP64, a następnie będę musiał zaktualizować łatki dla migracji do FlexiBLAS.

Jesus Michał "Le Sigh" 🏔 (he)mgorny@treehouse.systems
2025-09-14

1. Learn a bit about #BLAS / #LAPACK packaging for dayjob.
2. Learn that #MKL in #Gentoo is quite outdated. Take it over, bump it and improve the packaging.
3. Get curious about #FlexiBLAS. Start playing with it. Package it for #Gentoo.
4. Learn that runtime BLAS / LAPACK switching is quite broken. Come up with a FlexiBLAS transition plan and a proof-of-concept.
5. Notice inconsistency in ILP64 support flags. Propose unifying the behavior.
6. Learn that BLAS / LAPACK packages in Gentoo are pretty much unmaintained.

Well, looks like I'm the new maintainer of the whole stack, I'm working on consistent ILP64 support now, and then I'll have to rebase the FlexiBLAS transition bits.

Jezus Michał "Le Wzdych" (on)mgorny@pol.social
2025-09-13

Widzisz, że osoba z adresem e-mail #Debian .org opiekuje się paczkami #BLAS w #Gentoo, i myślisz sobie: "jak fajnie, że dystrybucje współpracują…"

A potem uświadamiasz sobie, że ta osoba wzięła tylko kasę z #GSoC w 2019, i zniknęła od razu po fakcie…

#WolneOprogramowanie

2025-09-07

Harnessing Batched BLAS/LAPACK Kernels on GPUs for Parallel Solutions of Block Tridiagonal Systems

#ROCm #CUDA #BLAS #Factorization #Package

hgpu.org/?p=30168

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst