hiyata (Alan)

upvoted a paper 23 days ago

Diffusion Models Are Real-Time Game Engines

Paper • 2408.14837 • Published 24 days ago • 119

upvoted a paper about 1 month ago

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Paper • 2408.06292 • Published Aug 12 • 114

upvoted a paper about 2 months ago

CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis

Paper • 2407.13301 • Published Jul 18 • 55

upvoted 5 papers 3 months ago

AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models

Paper • 2406.16714 • Published Jun 24 • 10

upvoted an article 3 months ago

Article

Introduction to State Space Models (SSM)

By

•

Jul 19

• 77

upvoted 21 papers 3 months ago

KAN: Kolmogorov-Arnold Networks

Paper • 2404.19756 • Published Apr 30 • 108

StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation

Paper • 2405.01434 • Published May 2 • 51

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published May 2 • 114

What matters when building vision-language models?

Paper • 2405.02246 • Published May 3 • 98

Your Transformer is Secretly Linear

Paper • 2405.12250 • Published May 19 • 149

DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data

Paper • 2405.14333 • Published May 23 • 32

Not All Language Model Features Are Linear

Paper • 2405.14860 • Published May 23 • 39

Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models

Paper • 2405.15574 • Published May 24 • 52

An Introduction to Vision-Language Modeling

Paper • 2405.17247 • Published May 27 • 84

Phased Consistency Model

Paper • 2405.18407 • Published May 28 • 46

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Paper • 2405.21060 • Published May 31 • 63

Block Transformer: Global-to-Local Language Modeling for Fast Inference

Paper • 2406.02657 • Published Jun 4 • 36

Tx-LLM: A Large Language Model for Therapeutics

Paper • 2406.06316 • Published Jun 10 • 13

Towards a Personal Health Large Language Model

Paper • 2406.06474 • Published Jun 10 • 17

Husky: A Unified, Open-Source Language Agent for Multi-Step Reasoning

Paper • 2406.06469 • Published Jun 10 • 23

Improve Mathematical Reasoning in Language Models by Automated Process Supervision

Paper • 2406.06592 • Published Jun 5 • 17

Hibou: A Family of Foundational Vision Transformers for Pathology

Paper • 2406.05074 • Published Jun 7 • 6

Chimera: Effectively Modeling Multivariate Time Series with 2-Dimensional State Space Models

Paper • 2406.04320 • Published Jun 6 • 7

Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing

Paper • 2406.08464 • Published Jun 12 • 61

Depth Anything V2

Paper • 2406.09414 • Published Jun 13 • 91

Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling

Paper • 2406.07522 • Published Jun 11 • 36

upvoted 2 papers 10 months ago

FusionFrames: Efficient Architectural Aspects for Text-to-Video Generation Pipeline

Paper • 2311.13073 • Published Nov 22, 2023 • 56

GAIA: a benchmark for General AI Assistants

Paper • 2311.12983 • Published Nov 21, 2023 • 182

upvoted a paper 11 months ago

BitNet: Scaling 1-bit Transformers for Large Language Models

Paper • 2310.11453 • Published Oct 17, 2023 • 96

Alan

AI & ML interests

Organizations

hiyata's activity