Research

Academic papers and theses exploring machine learning, optimization, and applied mathematics.

experimental-transformer-architectures

17 experimental language-model architectures where hidden dim = vocab size — no embedding, no output projection; every intermediate state is a distribution over vocabulary.

Pythonablation-studyinterpretable-mllanguage-modellinear-attentionpytorch+3

rlgp-thesisArchived

BCS Thesis: Reinforced Linear Genetic Programming

TeXarxivgenetic-programminglatexreinforcement-learningresearch+1

md-classifierArchived

A deep learning system combining transformers and CNNs to classify diseases from patient-described symptoms, achieving 90% recall through semantic embeddings and CNN feature extraction.

Jupyter Notebookcnnconvolutional-neural-networksdeep-learningdisease-classificationencodings+13

lepus-classifierArchived

A CNN research project exploring optimal image classification architectures for small datasets, demonstrating that data quantity remains the fundamental bottleneck for deep learning performance.

Jupyter Notebookbashcnncomputer-visiondeep-learningdocker+10