Ingénieur – Calcul de haute performance (CHP), stockage, unité de traitement graphique (UTG) / HPC/Storage/GPU Engineer
- $100k – $200k
- Full Time
Not Available
About the job
Ingénieur – Calcul de haute performance (CHP), stockage, unité de traitement graphique (UTG)
Nous sommes à la recherche d’un ingénieur – CHP, stockage, UTG hautement qualifié pour se joindre à notre équipe des technologies. Ce rôle est essentiel à la mise en œuvre de notre feuille de route technologique et à la mise en place de notre infrastructure à l’avant-garde de l’industrie. Le candidat idéal sera débrouillard, détiendra de l’expérience avec les environnements de production existants et sera expert dans la navigation et l’optimisation de solutions informatiques hautes performances, de systèmes de stockage et de planification. Vous devrez également proposer et encourager l’adoption des pratiques d’infrastructure en tant que code (IaC) pour rendre nos solutions de stockage évolutives et gérables, et développer nos besoins croissants en matière de processeur graphique, en équilibrant les ressources locales et infonuagiques. Une mentalité de développeur est essentielle pour créer des solutions évolutives, maintenables et efficaces. Notre infrastructure utilise une approche hybride, combinant des ressources locales et infonuagiques et nous avons besoin de compétences en conséquence.
Principales responsabilités
- Concevoir, mettre en œuvre et gérer les systèmes CHP pour soutenir les opérations commerciales.
- Proposer et mettre en œuvre une approche pour l’infrastructure en tant que code (IaC), en créant des interfaces de programmation (API) pour améliorer l’évolutivité et la gérabilité de notre stockage.
- Aborder les problèmes avec un esprit de développeur, en créant un code évolutif et maintenable pour améliorer notre infrastructure.
- Optimiser et maintenir les solutions de stockage en mettant l’accent sur la performance, la fiabilité et l’évolutivité.
- Élaborer et appliquer les meilleures pratiques et les lignes directrices en matière d’interaction de stockage afin d’assurer la sécurité et l’efficacité.
- Mettre en œuvre et gérer des solutions en lien avec les unités de traitement graphique pour accélérer les tâches informatiques, en équilibrant les ressources locales et infonuagiques.
- Collaborer avec des équipes interfonctionnelles pour améliorer la technologie et l’efficacité opérationnelle.
- Effectuer un diagnostic et résoudre des problèmes techniques complexes dans un environnement de production.
- Rester à jour des dernières technologies et pratiques exemplaires en matière de calcul de haute performance, de stockage et d’unité de traitement graphique.
Exigences
- Baccalauréat ou maîtrise en informatique, en ingénierie ou dans un domaine connexe
- Au moins 5 ans d’expérience en matière de calcul de haute performance, de systèmes de stockage et d’unités de traitement graphique.
- Solides compétences en communication et capacité à travailler efficacement en équipe.
- Une mentalité de développeur axée sur la création de solutions évolutives, durables et efficaces.
- Expérience en développement de logiciels, en particulier en rédaction de scripts et en automatisation à l’aide de langages comme Python.
- Connaissance des systèmes de fichiers parallèles (p. ex., GPFS), des systèmes de traitement par lots (p. ex., Slurm, Grid Engine); et des interconnexions réseau haute performance.
- Solides compétences en administration de systèmes Linux.
- Expérience avec les solutions de stockage VAST et Weka, un atout.
- Solide compréhension de l’infrastructure des marchés et des systèmes à faible latence.
- Excellentes compétences en résolution de problèmes et capacité à travailler dans un environnement dynamique où les activités se déroulent à un rythme rapide.
- Compétences en gestion d’environnements hybrides infonuagiques et locaux.
Compétences souhaitées
- Expérience avec les outils de conteneurisation et d’orchestration (p. ex., Docker, Kubernetes).
- Connaissance des plateformes infonuagiques et des environnements infonuagiques hybrides.
- Connaissance de l’automatisation à l’aide de Python.
- Expérience dans la proposition et la mise en œuvre complète de pratiques d’infrastructure en tant que code (IaC).
- Expertise en équilibrage des ressources d’unités de traitement graphique locales et infonuagiques pour optimiser les performances et les coûts.
Avantages
Le bureau de Tower est situé au centre-ville de Montréal et est facilement accessible par le transport en commun. Il est vrai que nous travaillons dur, mais le milieu de travail sans cubicule de Tower, son personnel en jeans et ses cuisines bien approvisionnées reflètent fidèlement l’importance que place l’entreprise sur la qualité de vie.
Parmi les avantages :
● Salaire concurrentiel et primes discrétionnaires
● Cinq semaines de vacances payées par année
● Dîner et collations au quotidien
● Remboursement des frais de santé et de bien-être
● Événements et ateliers gratuits
Tower Research Capital est un employeur qui souscrit au principe de l’égalité d’accès à l’emploi.
HPC/Storage/GPU Engineer
We are seeking a highly skilled HPC / Storage / GPU Engineer to join our technology team. This role is critical in driving our technology roadmap and ensuring our infrastructure remains at the forefront of the industry. The ideal candidate will be hands-on, experienced with existing production environments, and adept at navigating and optimizing high-performance computing, storage systems, and scheduling solutions. You will also be expected to propose and drive the adoption of Infrastructure as Code (IaC) practices to make our storage solutions scalable and manageable, and develop our growing needs with GPU, balancing on-premises and cloud-based resources. A developer mindset is essential to create scalable, maintainable, and efficient solutions. Our infrastructure employs a hybrid approach, combining cloud and on-premises resources, and we require skills accordingly.
Key Responsibilities
- Design, implement, and manage HPC systems to support trading operations.
- Propose and implement an approach for Infrastructure as Code (IaC), creating APIs to enhance scalability and manageability of our storage.
- Approach problems with a developer mindset, creating scalable and maintainable code to enhance our infrastructure.
- Optimize and maintain storage solutions, focusing on performance, reliability, and scalability.
- Develop and enforce best practices and guidelines for storage interaction to ensure security and efficiency.
- Implement and manage GPU-based solutions to accelerate computational workloads, balancing on-premises and cloud resources.
- Collaborate with cross-functional teams to drive technology enhancements and operational efficiency.
- Troubleshoot and resolve complex technical issues in a production environment.
- Stay up-to-date with the latest technologies and best practices in HPC, storage, and GPU computing.
Requirements
- Bachelor's or Master's degree in Computer Science, Engineering, or a related field.
- 5+ years of experience in HPC, storage systems, and GPU computing.
- Strong communication skills and the ability to work effectively in a team.
- A developer mindset, with a focus on creating scalable, maintainable, and efficient solutions.
- Experience in software development, particularly in scripting and automation using languages like Python.
- Knowledge of parallel file systems (e.g., GPFS), batch systems (e.g., Slurm, Grid Engine), and high-performance network interconnects.
- Strong Linux systems administration skills.
- Experience with VAST and Weka storage solutions is highly desirable.
- Solid understanding of trading infrastructure and low-latency systems.
- Excellent problem-solving skills and the ability to work in a fast-paced, dynamic environment.
- Skills in managing hybrid cloud/on-premises environments.
Preferred Qualifications
- Experience with containerization and orchestration tools (e.g., Docker, Kubernetes).
- Familiarity with cloud computing platforms and hybrid cloud environments.
- Knowledge of automation using Python.
- Experience proposing and implementing Infrastructure as Code (IaC) practices from the ground up.
- Expertise in balancing on-premises and cloud-based GPU resources to optimize performance and cost.
Benefits
Tower’s office is located in Downtown Montreal and is easily accessible by public transportation. While we work hard, Tower’s cubicle-free workplace, jeans-clad workforce, and well-stocked kitchens reflect the premium the firm places on quality of life. Benefits include:
- Competitive salary and discretionary bonuses
- 5 weeks of paid vacation per year
- Lunch and snacks on a daily basis
- Reimbursement for health and wellness expenses
- Free events and workshops
Tower Research Capital is an equal opportunity employer.