Sign in

Large Model Application Algorithm Research Scientist-International Content Security Algorithm Research-Soaring Star Talent Program

Singapore, Singapore

Entry-level Full Time

Apply Save

Found 9h ago

Tasks

Apply reinforcement learning to natural language tasks
Design reward models for reinforcement learning
Develop large language models
Evaluate model reasoning performance
Improve reasoning efficiency
Monitor and mitigate content risks
Train and stabilize reinforcement learning without supervised fine tuning

Perks/Benefits

N/A

Skills/Tech-stack

Chain-of-Thought | Data Compliance | Fine Tuning | Knowledge Distillation | Language Models | Language Processing | Large Language Models | Machine Learning | Model Evaluation | Monte Carlo | Monte-Carlo Tree Search | Natural Language | Natural Language Processing | Process-based Reward Model | Reinforcement Learning | Reward Model | Supervised Fine Tuning | Tree search

Education

Master of Science | PhD

Roles

Research Scientist | Scientist

Regions

Countries

Cities

Apply Save

Language: en | Views: 0 | Clicks: 0 | Saves: 0

Related jobs

Research Associate (Visual and Biosignal Data Analytics for Animal Stress Detection and Animal Health Monitoring)

Artificial Intelligence | Computer Vision | Data Processing | Data analytics | Deep learning

Mid-level Full Time

NTU Main Campus, Singapore

5d ago