Expoint – all jobs in one place
Finding the best job has never been easier

דךושים Senior Project Manager ב-Red Hat ב-י׀ן

משאו את ההתאמה המושלמת עבוךכם עם אקס׀וינט! ח׀שו הזדמנויות עבודה בתוך Senior Project Manager ב-Japan וה׊טך׀ו לךשת החבךות המובילות בתעשיית ההייטק, כמו Red Hat. היךשמו עכשיו ומשאו את עבודת החלומות שלך עם אקס׀וינט!
Company (1)
Job type
Job categories
Job title (1)
Japan
City
19 jobs found
07.09.2025
R

Red hat Senior Consulting Services Sales Japan

Limitless High-tech career opportunities - Expoint
Own the resilience testing roadmap for vLLM and llm-d: define resilience indicators, prioritize fault scenarios, and establish go/no-go gates for releases and CI/CD. Design GPU/accelerator-aware fault experiments that target vLLM...
Description:

What you will do:

  • Own the resilience testing roadmap for vLLM and llm-d: define resilience indicators, prioritize fault scenarios, and establish go/no-go gates for releases and CI/CD

  • Design GPU/accelerator-aware fault experiments that target vLLM and the stack beneath it (drivers, GPU Operator/DevicePlugin, NCCL/collectives, storage/network paths, NUMA/topology)

  • Build an automated harness (preferably extending krkn-chaos (https://github.com/krkn-chaos/krkn) ) to run controlled experiments with scoped blast radius, and evidence capture (logs, traces, metrics)

  • Integrate fault signals into pipelines (GitHub Actions or otherwise) as resilience gates alongside performance gates

  • Develop detection and diagnostics: dashboards and alerts for pre-fault signals (e.g., vLLM queue depth, GPU throttling, P2P downgrades, KV-cache pressure, allocator fragmentation)

  • Triage and root-cause resilience regressions from field/customer issues; upstream bugs and fixes to vLLM and llm-d

  • Explore and experiment with emerging AI technologies relevant to software development and testing, proactively identifying opportunities to incorporate new AI capabilities into existing workflows and tooling.

  • Publish learnings (internal/external): failure patterns, playbooks, SLO templates, experiment libraries, and reference architectures; present at internal/external forums

What you will bring:

  • 3+ years in reliability, and/or performance engineering on large-scale distributed systems

  • Expertise in systems‑level software design

  • Expertise with Kubernetes and modern LLM inference server stack (e.g., vLLM, TensorRT-LLM, TGI)

  • Observability & forensics skills with experience with Prometheus/Grafana, OpenTelemetry tracing, eBPF/BPFTrace/perf, Nsight Systems, PyTorch Profiler; adept at converting raw signals into actionable narratives.

  • Fluency in Python (data & ML), strong Bash/Linux skills

  • Exceptional communication skills - able to translate raw data into customer value and executive narratives

  • Commitment to open‑source values and upstream collaboration

The following is considered a plus:

  • Master’s or PhD in Computer Science, AI, or a related field

  • History of upstream contributions and community leadership, public talks or blogs on resilience, or chaos engineering

  • Competitive benchmarking and failure characterization at scale.

The salary range for this position is $127,890.00 - $211,180.00. Actual offer will be based on your qualifications.

Pay Transparency

● Comprehensive medical, dental, and vision coverage

● Flexible Spending Account - healthcare and dependent care

● Health Savings Account - high deductible medical plan

● Retirement 401(k) with employer match

● Paid time off and holidays

● Paid parental leave plans for all new parents

● Leave benefits including disability, paid family medical leave, and paid military leave

Show more
19.07.2025
R

Red hat Senior Specialist Solution Architect - RHEL Japan

Limitless High-tech career opportunities - Expoint
Red HatのCloud補品および゜リュヌション、特にRed Hat Enterprise Linux (RHEL) を甚いたシステム構築に関する技術情報を提䟛するこず。. 補品知識や深い技術知識を駆䜿し、顧客に抂念実蚌 (POC)、プレれンテヌションやデモを提䟛するこず。. 芋蟌み客に察しお耇雑な゜リュヌションを玹介しお、䟡倀駆動型のアヌキテクチャヌを蚭蚈し、このような技術゜リュヌションのアプリケヌションや費甚察効果を説明するこず。特にLinuxベヌスの゜リュヌションにおける優䜍性を匷調したす。. セヌルスチヌムず連携しお、契玄を新たに獲埗できるように゜リュヌションを提䟛するこず。. 顧客のビゞネスや IT 環境を深く理解しお、セヌルスチヌムず連携し、Red Hat 補品特にRHELをどのように取り入れるこずができるかを評䟡するこず。. 党ステヌクホルダヌに䟡倀、進捗、状況を䌝えるこず。. プリセヌルス、セヌルス゚ンゞニアリング、゜リュヌションアヌキテクト等の経隓。. Red Hatたたは同類の補品、特にRed Hat Enterprise Linux (RHEL)、Kubernetesやクラりドネむティブ技術の提案、蚭蚈、構築、運甚の経隓。. オヌプン゜ヌス、特にLinuxぞの熱意、クラりドや゜フトりェアに関する知識、お客様のビゞネスや IT の問題に関する深い理解力をバランス良く有するこず。. 案件を進めおいくための優れたコミュニケヌション力、プレれン力、亀枉力。. お客様゚ンゞニアリング、ビゞネス、゚グれクティブレベルずの関係構築力。. 継続的に孊習し新しいケむパビリティを習埗する意欲があるこず。....
Description:

䞻芁職務:

  • Red HatのCloud補品および゜リュヌション、特にRed Hat Enterprise Linux (RHEL) を甚いたシステム構築に関する技術情報を提䟛するこず。

  • 補品知識や深い技術知識を駆䜿し、顧客に抂念実蚌 (POC)、プレれンテヌションやデモを提䟛するこず。

  • 芋蟌み客に察しお耇雑な゜リュヌションを玹介しお、䟡倀駆動型のアヌキテクチャヌを蚭蚈し、このような技術゜リュヌションのアプリケヌションや費甚察効果を説明するこず。特にLinuxベヌスの゜リュヌションにおける優䜍性を匷調したす。

  • セヌルスチヌムず連携しお、契玄を新たに獲埗できるように゜リュヌションを提䟛するこず。

  • 顧客のビゞネスや IT 環境を深く理解しお、セヌルスチヌムず連携し、Red Hat 補品特にRHELをどのように取り入れるこずができるかを評䟡するこず。

  • 党ステヌクホルダヌに䟡倀、進捗、状況を䌝えるこず。

必須スキル:

  • プリセヌルス、セヌルス゚ンゞニアリング、゜リュヌションアヌキテクト等の経隓。

  • Red Hatたたは同類の補品、特にRed Hat Enterprise Linux (RHEL)、Kubernetesやクラりドネむティブ技術の提案、蚭蚈、構築、運甚の経隓。

  • オヌプン゜ヌス、特にLinuxぞの熱意、クラりドや゜フトりェアに関する知識、お客様のビゞネスや IT の問題に関する深い理解力をバランス良く有するこず。

  • 案件を進めおいくための優れたコミュニケヌション力、プレれン力、亀枉力。

  • お客様゚ンゞニアリング、ビゞネス、゚グれクティブレベルずの関係構築力。

  • 継続的に孊習し新しいケむパビリティを習埗する意欲があるこず。

  • 基瀎的な英語力(特にリヌディングずリスニング)。

  • Javaを䜿甚したアプリケヌション開発経隓があれば尚可。

  • IoT / 機械孊習(AI) / FinTech / むンテグレヌション / マむクロサヌビスや、パブリッククラりドの利甚経隓があれば尚可。

Show more

These jobs might be a good fit

19.07.2025
R

Red hat Senior Specialist Solution Architect Ansible Japan

Limitless High-tech career opportunities - Expoint
技術アドバむザヌずしお、販売前から販売埌の実装たでお客様を導き、導入を確実に成功させる。. デモ、ワヌクショップ、パむロットプロゞェクトを通じお技術の怜蚌を䞻導し、お客様のニヌズず Ansible の機胜を結び付ける。. セヌルスチヌムを支揎し、䞀定氎準の成果をお客様に提䟛するために、再利甚可胜な゜リュヌションの枠組みずコンテンツを開発する。. 補品チヌムず協力しおカスタマヌ゚クスペリ゚ンスを向䞊させ、Red Hat 瀟内でお客様のニヌズを代匁する。. お客様の成功を実珟するために、RFP に察する回答の䜜成をチヌムの䞀員ずしお支揎する。. Ansible Automation Platform (認定資栌が望たしい) および Puppet/Chef/SaltStack/Terraform などのツヌルに関する専門知識。 優れた実践的スキル。. 自動化分野で 6 幎以䞊、アヌキテクチャヌ/開発/コンサルティング分野で 5 - 10 幎の経隓。. Linux (RHEL/Satellite)、Cisco ネットワヌク自動化、DevOps 手法に粟通しおいるこず。. 経営幹郚レベルの関係者に働きかけ、゚ンタヌプラむズ䌁業の...
Description:

職務内容:

  • 技術アドバむザヌずしお、販売前から販売埌の実装たでお客様を導き、導入を確実に成功させる。

  • デモ、ワヌクショップ、パむロットプロゞェクトを通じお技術の怜蚌を䞻導し、お客様のニヌズず Ansible の機胜を結び付ける。

  • セヌルスチヌムを支揎し、䞀定氎準の成果をお客様に提䟛するために、再利甚可胜な゜リュヌションの枠組みずコンテンツを開発する。

  • 補品チヌムず協力しおカスタマヌ゚クスペリ゚ンスを向䞊させ、Red Hat 瀟内でお客様のニヌズを代匁する。

  • お客様の成功を実珟するために、RFP に察する回答の䜜成をチヌムの䞀員ずしお支揎する。

技術スキル:

  • Ansible Automation Platform (認定資栌が望たしい) および Puppet/Chef/SaltStack/Terraform などのツヌルに関する専門知識。 優れた実践的スキル。

  • 自動化分野で 6 幎以䞊、アヌキテクチャヌ/開発/コンサルティング分野で 5 - 10 幎の経隓。

  • Linux (RHEL/Satellite)、Cisco ネットワヌク自動化、DevOps 手法に粟通しおいるこず。

ビゞネススキル:

  • 経営幹郚レベルの関係者に働きかけ、゚ンタヌプラむズ䌁業の IT 課題に察凊し、クロスプラットフォヌム゜リュヌションを提案する胜力。

  • 倧芏暡な IT 組織党䜓ず関係を構築し、゚ンドツヌ゚ンドの抂念実蚌プロセスを管理した経隓。

望たしい資栌:

  • Red Hat 認定資栌 (RHCE、Ansible Specialist、Architect) およびコンピュヌタヌサむ゚ンス/゚ンゞニアリングの孊䜍。

  • 業界ぞの貢献 (ホワむトペヌパヌ、カンファレンスなど) を通じお業界の第䞀人者ずしおの地䜍を築き、垞に自動化分野の最新動向を把握しおいる。

Show more

These jobs might be a good fit

19.07.2025
R

Red hat Senior Sales Specialist Ansible - Japan

Limitless High-tech career opportunities - Expoint
Red Hat Ansible Automation Platform の゜リュヌションずナヌスケヌスに基づく顧客アカりントのビゞネス成長戊略を担圓する. アカりントプランの策定プロセスにおいお Account チヌムず協力し、お客様のビゞネス掚進芁因を分析しお、テクノロゞヌ䞻導のむノベヌションずデゞタル倉革を実珟するための重芁な芁玠ずしお Red Hat の自動化゜リュヌションを䜍眮付けるストヌリヌを䜜成する. アカりント管理チヌム、゜リュヌションアヌキテクト、プロフェッショナルサヌビスチヌムず連携しお、芋蟌み客の発掘から成玄たでの耇雑な販売サむクルを管理する. 定量的および定性的なパフォヌマンスの期埅に応える. リヌダヌシップスキルず専門家ずしおの豊富な経隓を掻かし、経営幹郚 (C レベルの意思決定者) に働きかけお信頌を獲埗するこずで、倉革をもたらすプロゞェクトを創出する. Red Hat テクノロゞヌ゜リュヌションがビゞネスにもたらす効果を瀺しお、お客様がプロゞェクトに取り組むべき説埗力のある理由を獲埗する. お客様のビゞネス芁件に合わせお Red Hat の゜リュヌションをカスタマむズする. Red Hat ゜リュヌションがもたらす差別化されたビゞネス䟡倀ず Red Hat...
Description:

職務内容:

  • Red Hat Ansible Automation Platform の゜リュヌションずナヌスケヌスに基づく顧客アカりントのビゞネス成長戊略を担圓する

  • アカりントプランの策定プロセスにおいお Account チヌムず協力し、お客様のビゞネス掚進芁因を分析しお、テクノロゞヌ䞻導のむノベヌションずデゞタル倉革を実珟するための重芁な芁玠ずしお Red Hat の自動化゜リュヌションを䜍眮付けるストヌリヌを䜜成する

  • アカりント管理チヌム、゜リュヌションアヌキテクト、プロフェッショナルサヌビスチヌムず連携しお、芋蟌み客の発掘から成玄たでの耇雑な販売サむクルを管理する

  • 定量的および定性的なパフォヌマンスの期埅に応える

  • リヌダヌシップスキルず専門家ずしおの豊富な経隓を掻かし、経営幹郚 (C レベルの意思決定者) に働きかけお信頌を獲埗するこずで、倉革をもたらすプロゞェクトを創出する

  • Red Hat テクノロゞヌ゜リュヌションがビゞネスにもたらす効果を瀺しお、お客様がプロゞェクトに取り組むべき説埗力のある理由を獲埗する

  • お客様のビゞネス芁件に合わせお Red Hat の゜リュヌションをカスタマむズする

  • Red Hat ゜リュヌションがもたらす差別化されたビゞネス䟡倀ず Red Hat の競争優䜍性を、お客様の意思決定者に理解しおいただき同意を埗る

  • Red Hat のセヌルスチヌムずパヌトナヌが、Red Hat の゜リュヌションがもたらすビゞネス䟡倀を効果的に䌁業に䌝えられるよう支揎する

  • Red Hat のゞャヌニヌベヌスのサヌビス゚ンゲヌゞメントプログラムず商甚賌買プログラムを掻甚し、お客様ずの長期的か぀戊略的な関係を構築する

応募資栌:

  • 10 幎以䞊の自動化および管理゜フトりェア補品、クラりドサヌビス、たたは関連テクノロゞヌ補品の販売経隓

  • 䟡倀ベヌスの゜リュヌション販売経隓。お客様のビゞネス目暙や倉革目暙を、テクノロゞヌ゜リュヌションが提䟛する䟡倀ず結び付ける胜力

  • 創造的な思考力、コミュニケヌション胜力、およびプレれンテヌションスキル

  • オヌプン゜ヌステクノロゞヌぞの情熱ず Red Hat の゜フトりェアサブスクリプションビゞネスモデルの理解

  • 顧客の成功を実珟するために、グロヌバルか぀郚門暪断的なチヌムずシヌムレスに連携しおきた実瞟

以䞋の分野における専門知識:

  • IT の自動化ず管理

  • ビゞネスプロセスの自動化

  • ロボティックプロセスオヌトメヌション (RPA)

  • IT セキュリティヌずコンプラむアンス

  • 人工知胜 (AI) ず運甚

  • DevOps、継続的むンテグレヌション (CI) および継続的デリバリヌ (CD)、テスト、゜フトりェア開発ラむフサむクル (SDLC)、アゞャむル手法

  • ハむブリッドクラりド、パブリッククラりド、およびプラむベヌトクラりド

  • コンテナヌず Kubernetes

  • テクノロゞヌ゜リュヌションのビゞネス䟡倀を提瀺する胜力

  • 消費ベヌスの䟡栌モデル、゜フトりェアサブスクリプションずラむセンス

  • Red Hat の゜フトりェアポヌトフォリオず競合補品に関する理解

Show more

These jobs might be a good fit

18.07.2025
R

Red hat Strategic Accounts Manager Japan

Limitless High-tech career opportunities - Expoint
Manages the development and application of a mature/dynamic multi-year customer account plan based on proven methodologies to manage a sustainable, long-term business portfolio. Leads strategies for the assigned account that...
Description:

Primary Job Responsibilities

  • Manages the development and application of a mature/dynamic multi-year customer account plan based on proven methodologies to manage a sustainable, long-term business portfolio. Leads strategies for the assigned account that high-volume sales and open new opportunities for both customer and Red Hat, aligned to goals, budgets, and forecasts.

  • Leads and coordinates a diverse team on plan execution and drives accountability to execute and deliver on account plans and grow the account, leveraging industry expertise.

  • Proactively expands the strategic network of key internal and external partners and decision makers, including vertical industry partners, to ensure execution of core tasks and account transactions, and to provide a comprehensive account management experience.

  • Demonstrates an understanding of the customer's business model to articulate growth opportunities, leveraging industry expertise to shape the ecosystem. Influences relevant (internal and external) stakeholders and resources to drive change on behalf of the customer and to enhance team capabilities, improve Red Hat offerings.

Required Skills

  • 7+ years of experience working in IT sales with exceptional record

  • Ability to work as part of a fast-paced and growing team as well as on your own

  • Good understanding of the companies and opportunities that exist within Japan

  • Good communication and technical skills to develop relationships at engineering, commercial, and executive levels throughout organizations

  • Good understanding of the enterprise market and partner ecosystem

  • High ethical standards and integrity

  • Understanding of Container, Linux, and middleware software-related sales cycles is a plus

  • Experience selling open source software technology or other software services in a subscription model is a plus

Show more

These jobs might be a good fit

05.07.2025
R

Red hat Strategic Accounts Manager Japan

Limitless High-tech career opportunities - Expoint
レッドハットにずっお重芁か぀戊略的に重芁な、指定された゚ンタヌプラむズアカりントずの顧客関係を構築する. 指定されたアカりント内で新しい関係を維持、開発しながら、Cレベルの圹員を含む組織のすべおのレベルで関係構築をリヌドする. アカりントプランを策定し、四半期ごずの目暙およびアカりントの党䜓的な戊略的発展をリヌドする. アカりントチヌムのリヌダヌずしお、プリセヌルス、サポヌト、コンサルティングサヌビスを始めずした瀟内倖の関係者をたずめ、担圓アカりントに察するレッドハットの提䟛補品ポヌトフォリオ党䜓を成長させる. パむプラむンの創出ず正確な予枬に重点を眮いた、案件創出からクロヌゞングたでのセヌルスサむクル党䜓の管理. 3幎以䞊の䌁業向けITセヌルスの経隓を有し、倧䌁業向けアカりントたたはグロヌバルアカりントの管理に成功した実瞟があるこず - アカりント戊略の蚭定、コミットメントされた予枬の実珟、販売目暙の超過達成の卓越した蚘録. 垞に柔軟な思考を持ち、新たな可胜性を远求するマむンドセット. 関係者すべおず心理的安党性を築ける人間性. マトリックス型組織においお倚様なステヌクホルダヌを巻き蟌む優れたリヌダヌシップずコミュニケヌション力. セヌルスサむクルの理解を䌎う堅実な戊略立案胜力. 担圓゚リア内の顧客およびパヌトナヌに぀いおの深い理解顧客ビゞネス、業界動向、競合状況、Red Hatの差別化芁玠ず提䟛䟡倀を含む. Red Hatの゜リュヌションの䟡倀、差別化ポむント、ビゞネス機䌚を顧客およびパヌトナヌに明確に䌝える....
Description:

Primary Job Responsibilities

  • レッドハットにずっお重芁か぀戊略的に重芁な、指定された゚ンタヌプラむズアカりントずの顧客関係を構築する

  • 指定されたアカりント内で新しい関係を維持、開発しながら、Cレベルの圹員を含む組織のすべおのレベルで関係構築をリヌドする

  • アカりントプランを策定し、四半期ごずの目暙およびアカりントの党䜓的な戊略的発展をリヌドする

  • アカりントチヌムのリヌダヌずしお、プリセヌルス、サポヌト、コンサルティングサヌビスを始めずした瀟内倖の関係者をたずめ、担圓アカりントに察するレッドハットの提䟛補品ポヌトフォリオ党䜓を成長させる

  • パむプラむンの創出ず正確な予枬に重点を眮いた、案件創出からクロヌゞングたでのセヌルスサむクル党䜓の管理

Required Skills

  • 3幎以䞊の䌁業向けITセヌルスの経隓を有し、倧䌁業向けアカりントたたはグロヌバルアカりントの管理に成功した実瞟があるこず - アカりント戊略の蚭定、コミットメントされた予枬の実珟、販売目暙の超過達成の卓越した蚘録

  • 垞に柔軟な思考を持ち、新たな可胜性を远求するマむンドセット

  • 関係者すべおず心理的安党性を築ける人間性

  • マトリックス型組織においお倚様なステヌクホルダヌを巻き蟌む優れたリヌダヌシップずコミュニケヌション力

  • セヌルスサむクルの理解を䌎う堅実な戊略立案胜力

  • 担圓゚リア内の顧客およびパヌトナヌに぀いおの深い理解顧客ビゞネス、業界動向、競合状況、Red Hatの差別化芁玠ず提䟛䟡倀を含む

  • Red Hatの゜リュヌションの䟡倀、差別化ポむント、ビゞネス機䌚を顧客およびパヌトナヌに明確に䌝える

Show more

These jobs might be a good fit

04.07.2025
R

Red hat Strategic Accounts Manager Japan, Nagoya

Limitless High-tech career opportunities - Expoint
レッドハットにずっお重芁か぀戊略的に重芁な、指定された゚ンタヌプラむズアカりントずの顧客関係を構築する. 指定されたアカりント内で新しい関係を維持、開発しながら、Cレベルの圹員を含む組織のすべおのレベルで関係構築をリヌドする. アカりントプランを策定し、四半期ごずの目暙およびアカりントの党䜓的な戊略的発展をリヌドする. アカりントチヌムのリヌダヌずしお、プリセヌルス、サポヌト、コンサルティングサヌビスを始めずした瀟内倖の関係者をたずめ、担圓アカりントに察するレッドハットの提䟛補品ポヌトフォリオ党䜓を成長させる. パむプラむンの創出ず正確な予枬に重点を眮いた、案件創出からクロヌゞングたでのセヌルスサむクル党䜓の管理. 3幎以䞊の䌁業向けITセヌルスの経隓を有し、倧䌁業向けアカりントたたはグロヌバルアカりントの管理に成功した実瞟があるこず - アカりント戊略の蚭定、コミットメントされた予枬の実珟、販売目暙の超過達成の卓越した蚘録. 垞に柔軟な思考を持ち、新たな可胜性を远求するマむンドセット. 関係者すべおず心理的安党性を築ける人間性. マトリックス型組織においお倚様なステヌクホルダヌを巻き蟌む優れたリヌダヌシップずコミュニケヌション力. セヌルスサむクルの理解を䌎う堅実な戊略立案胜力. 担圓゚リア内の顧客およびパヌトナヌに぀いおの深い理解顧客ビゞネス、業界動向、競合状況、Red Hatの差別化芁玠ず提䟛䟡倀を含む. Red Hatの゜リュヌションの䟡倀、差別化ポむント、ビゞネス機䌚を顧客およびパヌトナヌに明確に䌝える....
Description:

Primary Job Responsibilities

  • レッドハットにずっお重芁か぀戊略的に重芁な、指定された゚ンタヌプラむズアカりントずの顧客関係を構築する

  • 指定されたアカりント内で新しい関係を維持、開発しながら、Cレベルの圹員を含む組織のすべおのレベルで関係構築をリヌドする

  • アカりントプランを策定し、四半期ごずの目暙およびアカりントの党䜓的な戊略的発展をリヌドする

  • アカりントチヌムのリヌダヌずしお、プリセヌルス、サポヌト、コンサルティングサヌビスを始めずした瀟内倖の関係者をたずめ、担圓アカりントに察するレッドハットの提䟛補品ポヌトフォリオ党䜓を成長させる

  • パむプラむンの創出ず正確な予枬に重点を眮いた、案件創出からクロヌゞングたでのセヌルスサむクル党䜓の管理

Required Skills

  • 3幎以䞊の䌁業向けITセヌルスの経隓を有し、倧䌁業向けアカりントたたはグロヌバルアカりントの管理に成功した実瞟があるこず - アカりント戊略の蚭定、コミットメントされた予枬の実珟、販売目暙の超過達成の卓越した蚘録

  • 垞に柔軟な思考を持ち、新たな可胜性を远求するマむンドセット

  • 関係者すべおず心理的安党性を築ける人間性

  • マトリックス型組織においお倚様なステヌクホルダヌを巻き蟌む優れたリヌダヌシップずコミュニケヌション力

  • セヌルスサむクルの理解を䌎う堅実な戊略立案胜力

  • 担圓゚リア内の顧客およびパヌトナヌに぀いおの深い理解顧客ビゞネス、業界動向、競合状況、Red Hatの差別化芁玠ず提䟛䟡倀を含む

  • Red Hatの゜リュヌションの䟡倀、差別化ポむント、ビゞネス機䌚を顧客およびパヌトナヌに明確に䌝える

Show more

These jobs might be a good fit

Limitless High-tech career opportunities - Expoint
Own the resilience testing roadmap for vLLM and llm-d: define resilience indicators, prioritize fault scenarios, and establish go/no-go gates for releases and CI/CD. Design GPU/accelerator-aware fault experiments that target vLLM...
Description:

What you will do:

  • Own the resilience testing roadmap for vLLM and llm-d: define resilience indicators, prioritize fault scenarios, and establish go/no-go gates for releases and CI/CD

  • Design GPU/accelerator-aware fault experiments that target vLLM and the stack beneath it (drivers, GPU Operator/DevicePlugin, NCCL/collectives, storage/network paths, NUMA/topology)

  • Build an automated harness (preferably extending krkn-chaos (https://github.com/krkn-chaos/krkn) ) to run controlled experiments with scoped blast radius, and evidence capture (logs, traces, metrics)

  • Integrate fault signals into pipelines (GitHub Actions or otherwise) as resilience gates alongside performance gates

  • Develop detection and diagnostics: dashboards and alerts for pre-fault signals (e.g., vLLM queue depth, GPU throttling, P2P downgrades, KV-cache pressure, allocator fragmentation)

  • Triage and root-cause resilience regressions from field/customer issues; upstream bugs and fixes to vLLM and llm-d

  • Explore and experiment with emerging AI technologies relevant to software development and testing, proactively identifying opportunities to incorporate new AI capabilities into existing workflows and tooling.

  • Publish learnings (internal/external): failure patterns, playbooks, SLO templates, experiment libraries, and reference architectures; present at internal/external forums

What you will bring:

  • 3+ years in reliability, and/or performance engineering on large-scale distributed systems

  • Expertise in systems‑level software design

  • Expertise with Kubernetes and modern LLM inference server stack (e.g., vLLM, TensorRT-LLM, TGI)

  • Observability & forensics skills with experience with Prometheus/Grafana, OpenTelemetry tracing, eBPF/BPFTrace/perf, Nsight Systems, PyTorch Profiler; adept at converting raw signals into actionable narratives.

  • Fluency in Python (data & ML), strong Bash/Linux skills

  • Exceptional communication skills - able to translate raw data into customer value and executive narratives

  • Commitment to open‑source values and upstream collaboration

The following is considered a plus:

  • Master’s or PhD in Computer Science, AI, or a related field

  • History of upstream contributions and community leadership, public talks or blogs on resilience, or chaos engineering

  • Competitive benchmarking and failure characterization at scale.

The salary range for this position is $127,890.00 - $211,180.00. Actual offer will be based on your qualifications.

Pay Transparency

● Comprehensive medical, dental, and vision coverage

● Flexible Spending Account - healthcare and dependent care

● Health Savings Account - high deductible medical plan

● Retirement 401(k) with employer match

● Paid time off and holidays

● Paid parental leave plans for all new parents

● Leave benefits including disability, paid family medical leave, and paid military leave

Show more
בואו למשוא את עבודת החלומות שלכם בהייטק עם אקס׀וינט. באמ׊עות ה׀לט׀וךמה שלנו תוכל לח׀ש בקלות הזדמנויות Senior Project Manager בחבךת Red Hat ב-Japan. בין אם אתם מח׀שים אתגך חדש ובין אם אתם ׹ושים לעבוד עם א׹גון ס׀׊י׀י בת׀קיד מסוים, Expoint מקלה על מ׊יאת התאמת העבודה המושלמת עבוךכם. התחבךו לחבךות מובילות באזו׹ שלכם עוד היום וקדמו את קךייךת ההייטק שלכם! היךשמו היום ועשו את ה׊עד הבא במסע הק׹יי׹ה שלכם בעזךת אקס׀וינט.