BigQuery×東京都
の採用・求人一覧

データの力で究極の適材適所を実現するシニアデータサイエンティスト募集
ウォンテッドリー株式会社
 データサイエンティスト
- 年収 700万円 ~ 1,270万円
- 雇用形態: 正社員
- 更新日: 2024-12-10
- 勤務地: 東京都
求人に応募する
会社訪問アプリ「Wantedly Visit」は、個人と企業のマッチングサービスです。多様な嗜好や性質を持つ個人と企業が適切にマッチングできるようにするためには、データに基づいた出会いの最適化が必要です。私たちは、「ユーザーにどのコンテンツを提示するか」という責務を担う推薦システムを開発・改善することによって、プロダクトで生まれるマッチングの数を最大化することに注力しています。私たちデータサイエンティストは、目の前のモデリングだけではなくプロダクト全体のことを意識して行動しています。常に「ユーザーにとって本当に良い推薦とは何か？」を第一に考えることで現状のシステムに課題を発見し、ビジネスインパクトやユーザーへの影響を踏まえて問題設定を行います。さらに、実サービスに落とし込むことを考慮した上で統計学的手法や機械学習などのツールを駆使してその問題を解決することで、一歩ずつより良い推薦システムへと近づけていっています。PoCを繰り返すのではなく、実際にユーザーに価値を届けるための取り組みを行なっています。データ活用という軸で、良いプロダクトを作り続けてユーザーに価値を届けられる組織を一緒につくりたい！という方を募集しています。 - 課題発見のための分析 - 機械学習を活用した推薦モデルの開発 - 推論結果のプロダクトへの組み込み - 施策の効果検証とレポート作成 - 推薦システムのモニタリング、障害対応 - 機械学習PJの開発生産性の改善 - 機械学習・推薦アルゴリズムに関する研究開発 - データサイエンティストの採用活動 - 技術系カンファレンスでの登壇会社の定める業務 - シニアデータサイエンティスト / テックリード - PdM - エンジニアリングマネージャー - 言語：Python, Go, Ruby - ツール等：BigQuery, Elasticsearch, Kubernetes, gRPC 21% - 男性：100% - 女性：0%
ユーザーがまだ気づいていない価値を生み出すプロダクトマネージャー募集
ウォンテッドリー株式会社
 プロダクトマネージャー
- 年収 600万円 ~ 1,100万円
- 雇用形態: 正社員
- 更新日: 2024-12-10
- 勤務地: 東京都
求人に応募する
ウォンテッドリーのプロダクト（Wantedly Visit、Engagement Suite、Wantedly Hire）の価値を創造し、事業の成長をリードするPdMをお任せします。 - 市場分析を通し、各プロダクトの優位性の定義 - 各プロダクトの中長期および四半期での事業成長を実現するプロダクト戦略の作成 - プロダクト戦略の達成へ向け、ロードマップや施策の立案 - 新機能開発等において、デザイナーやエンジニアと共に要求と要件を決定、各施策の実行推進 - リリースした施策の振り返りの実施と、それに伴う戦略・戦術の再設計 - チームの生産性をあげるための、開発プロセス改善やチームビルディング等の実施会社の定める業務ウォンテッドリーでは Squad と呼ばれる単位でチームを形成します。Squad はそれぞれ事業成長へ向けた目標をもちます。Squad メンバーには、プロダクトマネージャーやエンジニア、デザイナーなど Squad の施策進行に必要なメンバーがすべてアサインされます。プロジェクトや部門間の調整タスクが限りなく少なく、プロダクト改善に集中できることがウォンテッドリーの特徴です。また、同じ職能のメンバーが知見を共有するために Chapter という枠組みも設けられています。 - 開発チームの構造： https://docs.wantedly.dev/introduction/dev-org - PdM領域をまとめるリーダー - Web領域のエンジニアとともに施策を進めるリーダ - コミュニケーション：GItHub, Slack - ドキュメンテーション：Google Workspace, Miro - デザイン：Figma - データ集計・分析：BigQuery, Looker 21%
過去と未来と向き合いサービスを成長させるバックエンドエンジニア募集！
ウォンテッドリー株式会社
 サーバーサイドエンジニア
- 年収 520万円 ~ 840万円
- 雇用形態: 正社員
- 更新日: 2024-12-10
- 勤務地: 東京都
求人に応募する
主力事業である、Wantedly Visit の Backend 領域の開発をお任せします。 - Webエンジニアとしてのプロダクト開発 - デザイナーとコミュニケーションし、プロダクトの外部品質を向上させる - プロダクト開発チーム生産性を上げるための施策の実行会社の定める業務 - Backend領域の課題解決をひっぱるテックリード - Backend領域をバックグラウンドに持ったエンジニアリングマネージャー - プロダクトマネージャー - Ruby, Ruby on Rails, Go, gRPC, Protocol Buffer, GraphQL, Pythonなど、問題領域に適した言語とフレームワークを採用 - Kubernetes, Docker を基盤とするマイクロサービス・アーキテクチャ - Amazon Aurora, BigQuery, Elasticsearchなどのミドルウェア 21%
メンバーの能力を引き出し持続的に成長する組織を作るエンジニアリングマネージャー
ウォンテッドリー株式会社
 エンジニアリングマネージャー
- 年収 800万円 ~ 1,270万円
- 雇用形態: 正社員
- 更新日: 2024-12-10
- 勤務地: 東京都
求人に応募する
- 開発組織の適切なタイミングでの構造改革 - エンジニア採用活動のエンジニアリング - チームビルディングの支援 - チームリーダーの目標設定と評価 - チームリーダーとの週次1on1、メンバーとの月次1on1 - ビジョンの浸透、組織文化の醸成会社の定める業務私たちは“メンバーの成長が組織の成長に直結する”と信じています。そして、常に良いプロダクトを作り続け、ユーザーに価値を届けられる組織であることを目指します。エンジニアリングマネージャーは、メンバーの能力を引き出すだけではなく、メンバーが自発的に行動し成長していく環境を作り出すことをミッションに様々なサポートをしていただきます。 - VP of Engineering - VP of Technology - Tech Lead（志向性が変化した場合、マネジメントからプロフェッショナルなキャリアへの異動なども可能です。） - Ruby, Ruby on Rails, Go, gRPC, Protocol Buffer, GraphQL, Python, TypeScript, React など、問題領域に適した言語とフレームワークを採用 - Kubernetes, Docker を基盤とするマイクロサービス・アーキテクチャ - Tensorflow(TensorBoard), gensim, scikit-learn, xgboostなどの機械学習ライブラリ - PostgreSQL, BigQuery, Elasticsearch, Dgraphなどのミドルウェア 21%
SaaSプロダクト｜ユーザービリティ向上とDX向上を担うフロントエンジニア募集！
any株式会社
 フロントエンドエンジニア
- 年収 600万円 ~ 1,000万円
- 雇用形態: 正社員
- 更新日: 2024-12-03
- 勤務地: 東京都
- リモートワーク可
求人に応募する
チームの中で特にフロントエンドに強みを持ったエンジニアとして、機能開発や改善でフロントエンドの重要な領域（コンポーネント設計、ライブラリ選定、CI/CD基盤等）に注力していただきます。（ご趣向に応じてフルサイクル/フルスタックに機能開発やサービス保守運用を担っていただくこともできます！）サービスを創るエンジニア”のキャッチコピーの名の下に顧客価値を追求して顧客、ビジネスサイド、PdM、デザイナーと協力してプロダクト体験から機能仕様を磨き込んで機能開発からプロダクト運用保守まで幅広く何でも対応いただきます。特に機能開発ではPdM, Designer, メンバーエンジニアを巻き込みPJを遂行する責任を担うリードエンジニアとしてのご活躍を期待しております。また、顧客数の増加とシステムの拡大とともに増加する運用保守業務や、技術基盤の品質改善を開発と並行して行う必要があるため、機能開発だけはなく”DevOps”に取り組んでいただきます。【業務内容】・Next.jsでのSPAフロントエンド開発・フロントエンドのCI/CD環境の整備・フロントエンド技術基盤のブラッシュアップ・アジャイル開発でのUIや仕様についてのユーザー目線での議論と意思決定・サービスの保守/運用業務【チーム体制】 ●サービスを創るエンジニアエンジニアをプログラムを書くプログラマーではなく "サービスを創るエンジニア" と呼称し日々顧客価値を追求しています。全社で掲げた"顧客体験の最大化"への一貫性を意識しつつ、顧客の成功を自社の成功と捉えるSaaSビジネスとのFit感、プロダクトだけではなくanyとお付き合いする一連に気持ちよさを感じていただくことなども重要視しています。 ●プロジェクト編成メンバーは20代前半~30代半ばをボリュームゾーンとして構成されており、業務委託を含み十数名のコアメンバーで開発を進めております。正社員と業務委託の関係はフラットで、開発ごとにメンバーを選定してアジャイルチームを発足させ開発を行っています。また、仕様変更、バグ、保守・問い合わせ、リファクタなど基盤改善等のOps周りを巻き取った "シン・カイゼンPJ" も発足し、開発をよりスピーディーに行える体制を構築しています。 ●Qast品質宣言プロダクトの品質を向上する取り組みとしてまず品質とは？を整理し「内部品質は最終的にサービス品質（顧客価値）に紐づくもの」という考え方を徹底して説いています。サービス品質を外部品質と内部品質に分解し、それぞれどのような思想を持って取り組んでいくかを言語化しています。内部品質は外部品質(=顧客価値)に影響を与えるものとして継続的に向上する 1. 内部品質は”個人のため”ではなく、”外部品質のため”にありサービス品質に影響を与える 2. “ベストプラクティス”や”綺麗なコード”から考えるのではなく、”チーム”や”サービス”への影響から考える 3. “個人へ依存する”のではなく、”仕組みとプロセス”で“個人の努力”をサポートする ●技術インフラアーキテクチャはAWSのサーバーレスや新しいサービスを積極的に使い構築をしています。コード面はSOLID原則、CleanArchitechture、DDDなどのエッセンスを取り入れて理論を用いての会話が多くされています。また、非TypeScriptの旧スタックからNext.js/NestJSの新スタックへリアーキテクチャ中です。フロントエンド：React/TypeScript サーバーサイド：Node.js/TypeScript/GraphQL/Python フレームワーク：Next.js, NestJS インフラ：AWS(EC2, Fargate, RDS, Opensearch...), GCP(BigQuery)
【フルリモート/SaaS自社サービス】エンジニアリングマネージャー
株式会社クロスビット
 エンジニアリングマネージャー
- 年収 900万円 ~ 1,050万円
- 雇用形態: 正社員
- 更新日: 2024-11-21
- 勤務地: 東京都
- リモートワーク可
求人に応募する
メインプロダクトである『らくしふ』開発チームのエンジニアリングマネージャーとして、メンバーのマネジメントから組織設計、開発プロセスの管理などをお任せいたします。 ● 主な技術スタック・バックエンド : Ruby on Rails (主サービス), Node.js, Python (一部サービスで利用) ・フロントエンド: Vue.js, React, Next.js, TypeScript, Vite ・インフラ: GCP CloudSQL(MySQL, PostgreSQL), AlloyDB, Cloud Pub/Sub, Cloud Storage, GCE, Cloud Load Balancers, Cloud Functions, Cloud Run, K8s(GKE), Cloud Logging, BigQuery, Sentry, New Relic, SendGrid ・シフトスケジューリング最適化: Rust ・認証基盤: Ruby on Rails ・モバイルアプリ: Dart, Flutter ・アプリバックエンド: Ruby on Rails ・BFF: TypeScript, NestJS ・開発環境: Docker, Docker Compose ・その他: GitHub, Slack, Metabase, Notion, BrowserStack, LINE APIs ● 業務内容【らくしふ開発チームの成果最大化に向けたマネジメント】　・チーム、個人のパフォーマンスを最大化するためのカルチャー作り、各種施策の企画と実行　・評価や目標設定、日々の1on1を通じたメンバーへの建設的なフィードバック　・事業やプロダクト拡大を見据えた組織設計、エンジニア採用や入社後のオンボーディング　・必要に応じて、開発業務をご担当いただくこともあります【らくしふ開発におけるリーダーシップ】　・エンジニアリングの最新トレンドや関連ニュースのキャッチアップ　・開発、コード品質、テスト、リリースのためのベストプラクティスを推進　・インフラ、オペレーションチームと協力し、プラットフォームの拡張性、信頼性、セキュリティの確保【プロダクト成長への貢献】　・プロダクトマネージャーが作成するロードマップをレビュー、開発への落とし込み　・プロダクトの新機能や改善のリリースを推進　・顧客の要望を満たしつつ、高品質な機能開発ができているか常に確認をする【事業成長への貢献】　・ステークホルダーと密に連携しながら顧客のニーズを理解し、ビジネス成長に向けたプロダクトの強化をリードする　・営業やマーケティングとのクロスコミュニケーションを通じ、顧客満足度向上を目的とした開発を推進 ● 開発体制と働き方・普段は1~2週間スプリントで機能開発を計画し、　・Github Pull Requestベースのコードレビュー　・Github Actionsによるテストとリリース　・ブランチマージを契機にしたGKE上へのデプロイ　などのCI/CD体制により、メインの機能デザインや実装に集中できる体制を整えました。・フルリモートで個人のパフォーマンスを重視した働き方をしており、出勤時間や退勤時間は個人に任せています。
【フルリモート/SaaS自社サービス】SRE&インフラエンジニア
株式会社クロスビット
 SRE
- 年収 600万円 ~ 900万円
- 雇用形態: 正社員
- 更新日: 2024-11-21
- 勤務地: 東京都
求人に応募する
◾️具体的な仕事内容クロスビット全社の多種多様な事業ドメインのインフラ運用・構築に携わっていただきます。クラウド環境の運用はもちろん、性能向上やコスト最適化の提案なども行っていただきます。・「らくしふ」の安定稼働を支えるインフラ基盤の構築・運用・改善・クラウド環境におけるセキュリティのベストプラクティスの知見共有とリスク管理・Kubernetesの運用・改善に関する深い知見の共有・本番稼働中のシステムの再構築や移行作業など・IaC化・CI/CDの見直し ◾️エンジニア組織について現在は4つのUnitでRuby on Rails + Vue3 + TypeScriptを用いて「らくしふ」を、Ruby on Rails + Next.js + TypeScriptを用いて「らくしふ労務管理」を開発しています。普段は1週間スプリントで機能開発を計画し、　・Github Pull Requestベースのコードレビュー　・Github Actionsによるテスト　・ブランチマージを契機にしたGKE上へのデプロイなどのCI/CD体制により、メインの機能デザインや実装に集中できる体制を整えました。また、エンジニアチームでの開発以外にギルド活動も行っており、技術領域ごとの課題に日々向き合っています。参考URL：5分で分かるクロスビットの開発チーム https://speakerdeck.com/xbit/5fen-tewakarukurosuhitutonohurotakutokai-fa-timu ◾️技術スタック・バックエンド : Ruby on Rails (主サービス), Node.js, Python (一部サービスで利用) ・フロントエンド: Vue.js, React, Next.js, TypeScript, Vite ・インフラ: K8s(GKE),GCP CloudSQL(MySQL, PostgreSQL), AlloyDB, Cloud Pub/Sub, Cloud Storage, GCE, Cloud Load Balancers, Cloud Functions, Cloud Run, Cloud Logging, BigQuery, Sentry, New Relic, SendGrid,CDK for Terraform ・シフトスケジューリング最適化: Rust ・認証基盤: Ruby on Rails ・モバイルアプリ: Dart, Flutter ・アプリバックエンド: Ruby on Rails ・BFF: TypeScript, NestJS ・開発環境: Docker, Docker Compose ・その他: GitHub, Slack, Metabase, Notion, BrowserStack, LINE APIs ◾️このポジションの魅力マルチバーティカル戦略で展開している大規模SaaSのインフラ環境のリアーキテクトフレックス且つ、リモートワークも可能であるため、自分に合った働き方が可能組織とプロダクトが急成長する中で、他エンジニアメンバーと模索しながらチームビルティングに関わることができる
【フルリモート/SaaS自社サービス】WEBアプリケーションエンジニア
株式会社クロスビット
 フルスタックエンジニア
- 年収 550万円 ~ 850万円
- 雇用形態: 正社員
- 更新日: 2024-11-21
- 勤務地: 東京都
求人に応募する
クロスビットではデスクレスワーカー向けのHR管理プラットフォームを提供しており、『らくしふ』『らくしふ労務管理』など、様々なプロダクトを開発しています。機能追加/ユーザー増加にともなう、DBレイヤー、Rubyコード、そしてブラウザ上でのランタイムパフォーマンス改善にも是非お力添え頂きたいと思います。【開発体制】・現在は4つの開発チームでRuby on Rails + Vue3 + TypeScriptを用いて「らくしふ」を、Ruby on Rails + Next.js + TypeScriptを用いて「らくしふ労務管理」を開発しています。・普段は1週間スプリントで機能開発を計画し、　・Github Pull Requestベースのコードレビュー　・Github Actionsによるテスト　・ブランチマージを契機にしたGKE上へのデプロイ　などのCI/CD体制により、メインの機能デザインや実装に集中できる体制を整えました。・フルリモートで個人のパフォーマンスを重視した働き方を重視しており、出勤時間や退勤時間は個人に任せています。・現在さまざまなサービスと機能を展開しており、さらなる開発組織を拡大しています。【既存プロジェクトの技術スタック】・バックエンド : Ruby on Rails (主サービス), Node.js, Python (一部サービスで利用) ・フロントエンド: Vue.js, React, Next.js, TypeScript, Vite ・インフラ: GCP CloudSQL(MySQL, PostgreSQL), AlloyDB, Cloud Pub/Sub, Cloud Storage, GCE, Cloud Load Balancers, Cloud Functions, Cloud Run, K8s(GKE), Cloud Logging, BigQuery, Sentry, New Relic, SendGrid ・シフトスケジューリング最適化: Rust ・認証基盤: Ruby on Rails ・モバイルアプリ: Dart, Flutter ・アプリバックエンド: Ruby on Rails ・BFF: TypeScript, NestJS ・開発環境: Docker, Docker Compose ・その他: GitHub, Slack, Metabase, Notion, BrowserStack, LINE APIs
グローバル成長を支える！TimeTreeのBackendエンジニア募集
株式会社TimeTree
サーバーサイドエンジニア
- 年収 400万円 ~ 1,100万円
- 雇用形態: 正社員
- 更新日: 2024-11-21
- 勤務地: 東京都
求人に応募する
- TimeTree Backend API(Ruby on Rails)の設計、開発、テスト、リリース - 社内管理ツールの開発、保守 - チームメンバーと連携しながらの開発、エンジニア視点からの提案 - 問い合わせや不具合の調査、修正 - 最新の技術トレンドのキャッチアップ、導入 - 既存機能の改善、最適化、保守 - 生産性向上のための自動化、効率化 - 正社員9名 - 各プロジェクトに参加するほか、横断したBackendチームにも所属していただきます世界中の人々が利用するサービスのAPIの開発に、大きな責任と裁量を持ち、遊び心を大切にしながら挑戦し続けています。主な業務はAPIの開発ですが、ユーザーインタビューにも積極的に参加し、プロダクトの改善に取り組んでいます。また、自分たちが作ったものに対しても、課題を深く理解し、積極的にフィードバックし、より良いアイデアを実現するために行動しています。また、カレンダーの開発にとどまらず、広告事業やギフトのEC事業など、さまざまな事業領域にまたがり、多様な職種のメンバーと協同しています。HRTを大切にし、お互いにわからないことを気軽に質問し合えるようなコミュニケーションを心がけています。また、問題をいち早く気付いてフォローし、チーム全体で解決に取り組んでいます。社内勉強会を企画・参加するメンバーも多く、新しい技術を学ぶだけでなく、積極的に新機能を利用したり、マイクロサービス化やModular Monolithなど、学びを実践に活かす文化があります。 - Ruby on Rails アプリ開発 - 言語：Ruby, SQL - フレームワーク：Ruby on Rails - 実行環境：AWS, GCP, Docker - DB：AWS Aurora(MySQL 8), Redis, DynamoDB - バージョン管理：GitHub - CI：CircleCI, GitHub Actions - 分析：BigQuery, Redash, Amplitude, Firebase - 監視：New Relic, Sentry, CloudWatch - コミュニケーション：TimeTree, Slack, GitHub, Notion, Sketch, Google Workspace - 今後ますます増えていくユーザーアクセスに耐えうるWebアプリケーションのアーキテクチャ設計、および最適なストレージの選定やスキーマ設計のリード - 定期的に行っているプロダクトのリファクタリングの方針を設計と、大きくなり続けるプロダクトコードを見通しより良いものに改善する - カレンダーの予定情報を用いながらデータ分析や機械学習を活用して、未来にターゲティングできる広告プロダクトのTimeTree Adsをユーザーからも広告主からも喜ばれるものに作り上げていく変更の範囲：会社が定める場所変更の範囲：会社が定める業務
6.5億調達済/437億データ/データで働き方を変革するデータ統括（CTO候補）
株式会社SalesNow
CTO
- 年収 1,000万円 ~ 2,000万円
- 雇用形態: 正社員
- 更新日: 2024-11-19
- 勤務地: 東京都
求人に応募する
「SalesNow」のデータチームを統括し、中長期的に競合優位性のあるデータベースを構築すべく、データガバナンスやデータマネージメントの立案から遂行までをご担当頂きます。 - データの収集から活用まで俊敏に行うことができる組織設計と運営 - 長期的に安定した運用を可能とする技術の選定と評価、運用 - 若手エンジニアやプロダクトマネージャの育成、指導 - データガバナンスの制定と運用 ※従事すべき業務の変更の範囲：有り ※就業場所の変更の範囲：無し ▼ナイルで執行役員CTOとして90名のプロダクト組織を牽引し上場を経験。次の1→10の環境としてSalesNowを選んだ理由。 https://note.com/salesnow/n/na4a09d15fcd0 ■進捗管理 -AsanaとNotion を利用したアジャイル開発 ( 週 1 回 30 分の定例 mtg ) -データベース技術勉強会（週1回60分） ■利用ツール：Google Workspace、Notion、Slack、Asana ■利用言語：Python、Scala、SQL ■利用技術：React、FastAPI、Scrapy、Databricks（Apache Spark）、Terraform ■利用データベース：Aurora（PostgreSQL）、Cloud Spanner、BigQuery、Lakehouse
6.5億調達済/データベース技術で働き方を変革！データエンジニア/437億データ
株式会社SalesNow
データエンジニア
- 時給 4,500円 ~ 7,000円
- 雇用形態: 副業転職(業務委託から正社員)
- 更新日: 2024-11-19
- 勤務地: 東京都
求人に応募する
【職種名】データエンジニア【業務内容】『SaaS+Database』サービスを支えるビッグデータ（数十TBオーダー）基盤の構築・改善以下のいずれか、もしくは複数を対応いただきます。 - Webデータクローリングのためのパイプライン新設や改善 - データのクレンジングやエンリッチメント処理 - データの品質改善を目的とした品質モニタリング環境の構築 - スケーラブルかつコスト効果の高いデータ基盤への改善 - 将来的なデータサイエンス活用を踏まえたデータ基盤やデータ品質整備設計 ※従事すべき業務の変更の範囲：有り ■進捗管理 - AsanaとNotion を利用したアジャイル開発 ( 週 1 回 30 分の定例 mtg ) - 週1回のメンターとの1on1による技術相談 - データベース技術勉強会（週1回60分）【主な技術スタック】 - データ収集 - Python（Scrapy） - AWS Fargate for Amazon ECS - Amazon Managed Workflows for Apache Airflow - データストア - Amazon S3 - Amazon Aurora PostgreSQL - データトランスフォーム - Apache Spark（PySparkがメイン。一部Scala Spark） - Databricks - その他 - GitHub - Slack - Notion - Asana - Google Workspace
6.5億調達済/データ技術で働き方を変えるデータサイエンティスト！437億データ
株式会社SalesNow
データサイエンティスト
- 年収 600万円 ~ 1,200万円
- 雇用形態: 正社員
- 更新日: 2024-11-19
- 勤務地: 東京都
求人に応募する
- SalesNowのビジネス課題を分析可能な課題へ分解し、適切な分析アプローチ・モデリング手法を設計・PJの推進を実施する →現在、SalesNowには日本全国の企業の属性データ(従業員数, 本社所在地, 設立年月日など)・行動データ(採用情報, ニュース情報など)が収集されています。その中で、「いまある情報」から、「価値のあるデータ」へと変換する機能・仕組みの提案やPJのリードを担って頂きます。それらを通じてSalesNowを、より付加価値の高いプロダクトへ昇華させるサポートをして頂きます。 - ビッグデータを利用した仮説検証・意思決定の支援 - ビッグデータを活用したモデル構築、及び、サービスのコア機能の開発 - 継続的なモデルの品質評価と改善 - Databricksを用いたデータクレンジング処理の設計/実装 - グラウンドトルゥースデータ作成プロセスの効率化と改善 ※従事すべき業務の変更の範囲：有り ※就業場所の変更の範囲：無し ▼ナイルで執行役員CTOとして90名のプロダクト組織を牽引し上場を経験。次の1→10の環境としてSalesNowを選んだ理由。 https://note.com/salesnow/n/na4a09d15fcd0
【Fintech】テックリード（フロントエンドエンジニア）
株式会社BANKEY
リードエンジニア
- 年収 800万円 ~ 1,199万円
- 雇用形態: 正社員
- 更新日: 2024-11-19
- 勤務地: 東京都
求人に応募する
- サービス開発全般プロダクト開発にあたりフロントエンド領域における開発及び運用業務のすべての工程に携わっていただきます。お客様に安心して決済をしていただけるサービスのために、革新的でわかりやすく安心感のあるUX開発や、そのために必要な課題の解決をしていただきます。これらを達成するためにも自由で活発な議論ができる開発チームを一緒に作っていける方であることを重要と考えています。サービスの新規開発と運用確立、チームリード設計開発レビュー：フロントエンド機能の開発及びテスト、プロダクトのリリースに必要な活動の実施 UX改善：リリース後のUX改善点の発見や改善提案及びそのための運用方式の設計などの実施問い合わせ対応：社内外から来るプロダクトの仕様や不具合調査などプロジェクト進行：チームで開発を進めるにあたり、コミュニケーションや開発運用についての改善など、開発生産性を高めるあらゆる活動 - 開発言語：Go、Dart、Terraform - フレームワーク：Gin、flutter、REST API、OpenID Connect - インフラ：GCP（Apigee, Cloud Run, Cloud Tasks, PubSub, Identity Platform, Spanner, Memorystore） - テスト：testify、Tavern - CI/CD：GitHub Actions, Cloud Build - 分析基盤：BigQuery, Looker Studio - コード管理：GitHub - プロジェクト管理：GitHub Project - 情報共有：Google Drive、Docusaurus - コミュニケーションツール：Slack - デザイン：Figma - 開発支援：GitHub Copilot, GoLand, OrbStack
【Fintech】フロントエンドエンジニア
株式会社BANKEY
フロントエンドエンジニア
- 年収 600万円 ~ 1,000万円
- 雇用形態: 正社員
- 更新日: 2024-11-19
- 勤務地: 東京都
求人に応募する
- サービス開発全般決済系のサービス構築に際してフロントの「決済体験（フリクション）がない体験」の実装に向けバックエンド・インフラに意を配しながらの開発速度の向上を図っていただきたいです。一旦出来上がったサービスは存在するが機能追加を含めて今後更に拡充が必要というフェーズで「0→1」に近い開発・実装に少数精鋭チームで取り組みます。既存プロダクトや新規プロダクトにおける、フロントエンドの実装から上流工程への展開を展望します。プロダクトマネージャーやビジネスチーム、デザインチームと協力しながら、開発、テスト、QA、運用まで、多くのフェーズに参画することができます。 - 開発言語：Go、Dart、Terraform - フレームワーク：Gin、flutter、REST API、OpenID Connect - インフラ：GCP（Apigee, Cloud Run, Cloud Tasks, PubSub, Identity Platform, Spanner, Memorystore） - テスト：testify、Tavern - CI/CD：GitHub Actions, Cloud Build - 分析基盤：BigQuery, Looker Studio - コード管理：GitHub - プロジェクト管理：GitHub Project - 情報共有：Google Drive、Docusaurus - コミュニケーションツール：Slack - デザイン：Figma - 開発支援：GitHub Copilot, GoLand, OrbStack
【Ruby】月間ユーザー3000万以上のサービスを支えるバックエンドエンジニア
株式会社マイベスト
 サーバーサイドエンジニア
- 年収 6,000,000万円 ~ 11,000,000万円
- 雇用形態: 正社員
- 更新日: 2024-11-14
- 勤務地: 東京都
求人に応募する
当社の開発組織は、定常的にビジネス組織と折衝しながら、事業成長にインパクトのある機能開発を推進しています。そのため、ビジネス側からの依頼をそのまま実装するのではなく、事業・技術の両側面から本質的に解くべき課題を思考・議論・定義した上で、事業成長にインパクトのある機能を実装することが開発組織のメンバーには期待されています。・Ruby（Ruby on Rails）を中心としたプロダクト開発・バックエンドチーム内での担当領域の設計方針策定や推進・バックエンドに関するDXの改善提案と実施・フロントエンド含むチームメンバーが開発できるようにドキュメントの整備や勉強会の開催・ビジネス課題チームのバックエンド開発をリード、およびフロントエンドの方針に則ったフロントエンド開発 ※ フロントエンドの開発は必須という訳ではありませんが積極的に関わっていただくことは歓迎です！より具体的な課題は下記Notionをご覧ください。 https://www.notion.so/mybestcom/74263b2f4dbc4b598b907961a43c0f21 - 事業課題ごとにチームを編成し、OKRを目標設定に活用することで、メンバーが自発的に行動しやすい体制を整えています - 技術的負債やチャレンジにも十分な理解を持ち、事業課題と同様に改善の目標を持って取り組むことができる仕組みを構築しています - 仕事の進め方にはスクラムのプラクティスを採用し、JIRA、Notion、Miroなどのツールを活用しながら効率的な開発を行っています - ユーザーインタビューやABテストを織り交ぜながら、定性と定量の両面を大切に考えながら開発を推進しています - チーム単位で出社とリモートの頻度を調整しながら、最適な働き方を選択しています - 定期的な社内勉強会を通じた技術学習や、利用言語に関するカンファレンススポンサーシップ（例：RubyKaigiなど）、勉強会参加や書籍購入の補助など、専門性を向上させるための取り組みに積極的に会社がサポートしています - 技術とプロダクトに対する熱意と関心を持ち、個々の専門知識を活かして事業課題を解決する意欲あるエンジニアが多く在籍しています - コミュニケーションを重視する風土があり、メンバーは文章や口頭のコミュニケーションの両方を気軽に行えるような環境で働いています - 技術的な知識のインプットとアウトプットを重視し、開発ブログや社内LT、会社イベント（ハッカー鮨など）を通じて、エンジニア同士での情報共有や技術文化の促進を積極的に推奨しています
【副業スタート可】SaaS TROCCO®ソフトウェアエンジニア（リモート可）
株式会社primeNumber
サーバーサイドエンジニア
- 年収 600万円 ~ 1,500万円
- 雇用形態: 副業転職(業務委託から正社員)
- 更新日: 2024-11-07
- 勤務地: 東京都
- リモートワーク可
求人に応募する
ソフトウェアエンジニア（SaaS開発）データ活用に必要な分析基盤構築や運用にかかるデータエンジニアの手間を削減すべく、新機能開発、データソース（DB、広告API）への対応、顧客要望対応、海外展開に伴う開発など、TROCCO®がより広く・深く課題を解決するための開発を行います。開発例：・データパイイプライン設定変更履歴を確認する機能の開発・設定をGitHubにエクスポートする機能の開発・SlackのユーザーリストをBigQueryに対して転送する機能の開発・各種バグの調査　etc.. 【勤務時間】 09:00～18:00 時間応相談 12時間/週以上の稼働必須週1回、平日8時-20時のどこかで30分程度、定例MTG必須フルリモート可 ◇開発環境・言語 Ruby（Ruby on Rails）、TypeScript（React）、Java（Embulk）・インフラ AWS（EKS、ECS、etc..）・その他 Kubernetes、CircleCI、Slack、GitHub、Rollbar、New Relic
リードエンジニア／テックリード
株式会社クロスビット
 フルスタックエンジニア
- 年収 650万円 ~ 950万円
- 雇用形態: 正社員
- 更新日: 2024-10-16
- 勤務地: 東京都
- リモートワーク可
求人に応募する
* 開発チームのリード * 技術的な課題解決 * 開発工程の進行及びレビュー * 新技術導入時の調査、検証、PoC * PdMやプロダクトデザイナーと連携して行う、機能仕様の決定や開発計画の策定基本的には1週間スプリントで機能開発を計画・運用し、 * Github Pull Requestベースのコードレビュー * Github Actionsによるテスト * ブランチマージを契機にしたGKE上へのデプロイなどのCI/CD体制により、メインの機能デザインや実装に集中できる体制を整えています。また、プロダクト開発以外にギルド活動も行っており、技術領域ごとの課題に日々向き合ったチーム横断型のノウハウをシェアする活動を行っています。参考URL：5分で分かるクロスビットの開発チーム https://speakerdeck.com/xbit/5fen-tewakarukurosuhitutonohurotakutokai-fa-timu * バックエンド : Ruby on Rails (主サービス), Node.js, Python (一部サービスで利用)、Sorbet * フロントエンド: Vue.js, React, Next.js, TypeScript, Vite * インフラ: GCP CloudSQL(MySQL, PostgreSQL), AlloyDB, Cloud Pub/Sub, Cloud Storage, GCE, Cloud Load Balancers, Cloud Functions, Cloud Run, K8s(GKE), Cloud Logging, BigQuery, Sentry, New Relic, SendGrid * シフトスケジューリング最適化: Rust * 認証基盤: Ruby on Rails * モバイルアプリ: Dart, Flutter * アプリバックエンド: Ruby on Rails * BFF: TypeScript, NestJS * 開発環境: Docker, Docker Compose * その他: GitHub, Slack, Metabase, Notion, BrowserStack, LINE APIs
【Fintech】フルスタックエンジニア
株式会社BANKEY
フルスタックエンジニア
- 年収 600万円 ~ 1,000万円
- 雇用形態: 正社員
- 更新日: 2024-10-09
- 勤務地: 東京都
求人に応募する
- サービス開発全般プロダクト開発にあたり必要な開発及び運用業務のすべての工程に携わっていただきます。お客様に安心して決済をしていただけるサービスのためにセキュリティにこだわりつつも、革新的なUXと安価な決済手数料を達成するためにあらゆる開発の工夫や課題の解決をしていただきます。これらを達成するためにも自由で活発な議論ができる開発チームを一緒に作っていける方であることを重要と考えています。 - サービスの新規開発と運用確立 1. 設計開発：機能やインフラの開発及びテストなど、領域に縛られずプロダクトのリリースに必要な活動の横断的な実施 2. 運用：リリース後の運用及びそのための運用方式の設計や運用訓練など 3. 問い合わせ対応：社内外から来るプロダクトの仕様や不具合調査など 4. プロジェクト進行：チームで開発を進めるにあたり、コミュニケーションや開発運用についての改善など、開発生産性を高めるあらゆる活動 - 開発言語：Go、Dart、Terraform - フレームワーク：Gin、flutter、REST API、OpenID Connect - インフラ：GCP（Apigee, Cloud Run, Cloud Tasks, PubSub, Identity Platform, Spanner, Memorystore） - テスト：testify、Tavern - CI/CD：GitHub Actions, Cloud Build - 分析基盤：BigQuery, Looker Studio - コード管理：GitHub - プロジェクト管理：GitHub Project - 情報共有：Google Drive、Docusaurus - コミュニケーションツール：Slack - デザイン：Figma - 開発支援：GitHub Copilot, GoLand, OrbStack
【Fintech】バックエンドエンジニア
株式会社BANKEY
サーバーサイドエンジニア
- 年収 600万円 ~ 1,000万円
- 雇用形態: 正社員
- 更新日: 2024-10-09
- 勤務地: 東京都
求人に応募する
- バックエンド開発全般プロダクト開発にあたり必要な開発及び運用業務のすべての工程に携わっていただきます。その中でも主にバックエンドの開発を担っていただきます。お客様に安心して決済をしていただけるサービスのためにセキュリティにこだわりつつも、革新的なUXと安価な決済手数料を達成するためにあらゆる開発の工夫や課題の解決をしていただきます。これらを達成するためにも自由で活発な議論ができる開発チームを一緒に作っていける方であることを重要と考えています。 - サービスの新規開発と運用確立 1. 設計開発：バックエンドアプリケーションの設計開発テストなど開発工程の実施、及び関連する一部インフラの設計開発テスト 2. 運用：リリース後の運用及びそのための運用方式の設計や運用訓練など 3. 問い合わせ対応：社内外から来るプロダクトの仕様や不具合調査など 4. プロジェクト進行：チームで開発を進めるにあたり、コミュニケーションや開発運用についての改善など、開発生産性を高めるあらゆる活動 - 開発言語：Go、Dart、Terraform - フレームワーク：Gin、flutter、REST API、OpenID Connect - インフラ：GCP（Apigee, Cloud Run, Cloud Tasks, PubSub, Identity Platform, Spanner, Memorystore） - テスト：testify、Tavern - CI/CD：GitHub Actions, Cloud Build - 分析基盤：BigQuery, Looker Studio - コード管理：GitHub - プロジェクト管理：GitHub Project - 情報共有：Google Drive、Docusaurus - コミュニケーションツール：Slack - デザイン：Figma - 開発支援：GitHub Copilot, GoLand, OrbStack
【Fintech】QAエンジニア
株式会社BANKEY
QAエンジニア
- 年収 600万円 ~ 1,000万円
- 雇用形態: 正社員
- 更新日: 2024-10-09
- 勤務地: 東京都
求人に応募する
- サービス品質保証全般プロダクト開発における開発及び運用業務のすべての工程における品質保証に携わっていただきます。お客様に安心して決済をしていただけるサービスのためにセキュリティと安定的なサービス品質にこだわった工夫や課題の解決をしていただきます。これらを達成するためにも自由で活発な議論ができる開発チームを一緒に作っていける方であることを重要と考えています。 - サービス開発及び運用における品質管理 1. テスト計画策定：テスト工程の整理や品質保証範囲、測定すべきメトリクスの定義など、プロダクトの品質やセキュリティの確保に必要な活動計画の策定 2. テストの主導的実施：テスト計画に定めた事項の実施とチームの主導 3. 品質分析：特にインシデント発生時におけるプロダクト品質の分析と文書化及び報告 4. プロジェクト進行：チームで開発を進めるにあたり、コミュニケーションや開発運用についての改善など、開発生産性を高めるあらゆる活動 - 開発言語：Go、Dart、Terraform - フレームワーク：Gin、flutter、REST API、OpenID Connect - インフラ：GCP（Apigee, Cloud Run, Cloud Tasks, PubSub, Identity Platform, Spanner, Memorystore） - テスト：testify、Tavern - CI/CD：GitHub Actions, Cloud Build - 分析基盤：BigQuery, Looker Studio - コード管理：GitHub - プロジェクト管理：GitHub Project - 情報共有：Google Drive、Docusaurus - コミュニケーションツール：Slack - デザイン：Figma - 開発支援：GitHub Copilot, GoLand, OrbStack

https://offers.jp/events/seminar_39?utm_source=jobs&utm_medium=toc_event_20241217&utm_campaign=sidebar_banner01

https://offers.jp/events/seminar_40?utm_source=jobs&utm_medium=toc_event_20241223&utm_campaign=sidebar_banner02

職種から求人を探す

開発言語から探す

年収・時給から探す

稼働時間から探す

その他の条件から探す

お知らせ

お問い合わせ

新規ユーザー登録

アカウントを作成して、求人情報のブックマークや応募の管理ができます。

登録特典:

・求人情報のブックマーク
・高度な求人検索
・スカウトメール受信

無料会員登録

求人に関するサマリ

BigQueryの転職・正社員求人、副業・業務委託案件、募集をお探しの方へ

本ページでは、BigQueryの転職・正社員求人、副業・業務委託案件、募集の傾向・特徴から、BigQueryについての概要、BigQuery求人に役立つ資格やスキルなどをご紹介します。BigQueryの転職・正社員求人、副業・業務委託案件、募集をお探しの方もぜひ、あなたの次のキャリアステップを見つける手がかりとしてご活用ください。

BigQueryの転職・正社員求人、副業・業務委託案件、募集の傾向・特徴

まずは、OffersにおけるBigQueryの求人・案件の傾向・特徴をご紹介いたします。2024年7月8日現在、Offers上で募集しているBigQueryの求人・案件数は26件（※公開求人・案件のみ）です。また、雇用形態別のBigQueryの求人・案件数は次のとおりです。

BigQueryの転職・正社員求人数：17件（※公開求人のみ）(※2024年7月8日現在）
BigQueryの正社員（業務委託からスタートOK）求人・案件数：11件（※公開求人・案件のみ）(※2024年7月8日現在）
BigQueryの副業・フリーランス・業務委託求人・案件数：20件（※公開求人・案件のみ）(※2024年7月8日現在）

BigQueryの求人・案件の年収・時給単価データ分布

BigQueryの転職・正社員求人の年収データ分布

2024年7月8日現在、Offers上で募集しているBigQueryのすべての転職・正社員求人：17件の最低年収、最高年収データ（※公開求人のみ）は次のとおりです。

BigQueryの転職・正社員求人における最低年収：1,000万円
BigQueryの転職・正社員求人における最高年収：1,200万円

BigQueryの副業・フリーランス・業務委託求人・案件数の時給単価データ分布

2024年7月8日現在、Offers上で募集しているBigQueryの副業・フリーランス・業務委託求人・案件数：20件の最低時給単価、最高時給単価（※公開求人のみ）は次のとおりです。

BigQueryの副業・フリーランス・業務委託求人・案件における最低時給単価：4,000円
BigQueryの副業・フリーランス・業務委託求人・案件における最高時給単価：5,000円

BigQueryの求人・案件における年収・時給単価データ分布

次に、OffersにおけるBigQueryの求人・案件の年収・時給単価データ分布をご紹介いたします。2024年7月8日現在、Offers上で募集しているBigQueryのすべての求人・案件：26件の年収データ分布（※公開求人のみ）は次のとおりです。

BigQueryの転職・正社員求人における最低年収データ分布

2024年7月8日現在、Offers上で募集しているBigQueryのすべての転職・正社員求人：17件の最低年収データ分布（※公開求人かつ最低年収が設定されている求人のみ）は次のとおりです。

300万円〜349万円：0件
350万円〜399万円：0件
400万円〜449万円：0件
450万円〜499万円：0件
500万円〜549万円：1件
550万円〜599万円：1件
600万円〜649万円：1件
650万円〜699万円：0件
700万円〜749万円：0件
750万円〜799万円：0件
800万円〜849万円：1件
850万円〜899万円：0件
900万円〜949万円：0件
950万円〜999万円：0件
1,000万円〜1,049万円：0件
1,050万円〜1,099万円：0件
1,100万円〜1,149万円：0件
1,150万円〜1,199万円：0件
1,200万円〜1,249万円：0件
1,250万円〜1,299万円：0件
1,300万円〜1,349万円：0件
1,350万円〜1,399万円：0件
1,400万円〜1,449万円：0件
1,450万円〜1,499万円：0件

BigQueryの転職・正社員求人における最高年収データ分布

2024年7月8日現在、Offers上で募集しているBigQueryのすべての転職・正社員求人：17件の最高年収データ分布（※公開求人かつ最高年収が設定されている求人のみ）は次のとおりです。

300万円〜349万円：0件
350万円〜399万円：0件
400万円〜449万円：0件
450万円〜499万円：0件
500万円〜549万円：0件
550万円〜599万円：0件
600万円〜649万円：0件
650万円〜699万円：0件
700万円〜749万円：0件
750万円〜799万円：0件
800万円〜849万円：0件
850万円〜899万円：0件
900万円〜949万円：0件
950万円〜999万円：0件
1,000万円〜1,049万円：2件
1,050万円〜1,099万円：0件
1,100万円〜1,149万円：0件
1,150万円〜1,199万円：0件
1,200万円〜1,249万円：2件
1,300万円〜1,349万円：0件
1,350万円〜1,399万円：0件
1,400万円〜1,449万円：0件
1,450万円〜1,499万円：0件

BigQueryの副業・業務委託・フリーランス求人・案件数

さらに、OffersにおけるBigQueryの副業・業務委託・フリーランス求人・案件数の傾向をご紹介します。2024年7月8日現在、Offersで募集しているBigQueryの副業・業務委託・フリーランス求人・案件数は20件（※公開求人のみ）となっています。

BigQueryの副業・業務委託・フリーランス求人・案件数における時給・単価データ分布

2024年7月8日現在、Offers上で募集しているBigQueryの副業・業務委託・フリーランス求人・案件の時給・単価データ分布（※公開求人のみ）は次のようになっています。

BigQueryの副業・業務委託・フリーランス求人・案件における最低時給・単価データ分布

1,000円〜1,499円：0件
1,500円〜1,999円：0件
2,000円〜2,499円：0件
2,500円〜2,999円：0件
3,000円〜3,499円：0件
3,500円〜3,999円：0件
4,000円〜4,499円：1件
4,500円〜4,999円：0件
5,000円〜5,499円：3件
5,500円〜5,999円：0件
6,000円〜6,499円：0件
6,500円〜6,999円：0件
7,000円〜7,499円：0件
7,500円〜7,999円：0件

BigQueryの副業・業務委託・フリーランス求人・案件における最高時給・単価データ分布

1,000円〜1,499円：0件
1,500円〜1,999円：0件
2,000円〜2,499円：0件
2,500円〜2,999円：0件
3,000円〜3,499円：0件
3,500円〜3,999円：0件
4,000円〜4,499円：0件
4,500円〜4,999円：0件
5,000円〜5,499円：0件
5,500円〜5,999円：0件
6,000円〜6,499円：1件
6,500円〜6,999円：0件
7,000円〜7,499円：0件
7,500円〜7,999円：0件

BigQueryとは何か

基本概念

BigQueryは、Googleが提供する強力なクラウドデータウェアハウスサービスです。大規模なデータセットを高速に分析し、複雑なクエリを実行できる能力を持っています。従来のデータベースシステムとは異なり、BigQueryはサーバーレスアーキテクチャを採用しているため、インフラストラクチャの管理に煩わされることなく、データ分析に集中できるのが特徴です。

このサービスは、ペタバイト規模のデータを数秒で処理できる圧倒的なパフォーマンスを誇ります。そのため、企業や組織が持つ膨大なデータから迅速に洞察を得ることが可能となり、ビジネス上の意思決定をデータドリブンに行うことをサポートします。BigQueryの登場により、データ分析の世界は大きく変わったと言えるでしょう。

BigQueryの基本的な仕組みは、データを列指向のストレージに保存し、分散処理システムを使って並列にクエリを実行することにあります。これにより、従来のRDBMSでは難しかった大規模データの高速分析が実現しています。データサイエンティストやアナリストにとって、BigQueryは強力な武器となっているのです。

主要な特徴

BigQueryの主要な特徴には、以下のようなものがあります。まず、スケーラビリティが挙げられます。数テラバイトから数ペタバイトまで、データ量に応じて自動的にスケールアップするため、ユーザーは規模を気にすることなくデータ分析に専念できます。

次に、高速性です。BigQueryは、GoogleのColossusファイルシステムとBorgクラスタ管理システムを基盤としているため、驚異的な処理速度を実現しています。例えば、1兆行のデータに対するクエリを数秒で処理することも可能です。

さらに、使いやすさも大きな特徴です。SQLライクな言語であるStandardSQLをサポートしているため、SQLに慣れた開発者やアナリストであれば、すぐに使いこなすことができます。また、WebUIやCLI、各種プログラミング言語用のクライアントライブラリなど、多様なインターフェースを提供しているのも魅力的です。

BigQueryの利用方法

Google Cloudアカウントの作成

BigQueryを利用するには、まずGoogle Cloudアカウントが必要です。アカウント作成は比較的簡単で、クレジットカード情報を入力するだけで完了します。新規ユーザーには300ドル相当の無料クレジットが提供されるため、初期段階での実験的な利用にも適しています。

アカウント作成後は、Google Cloud Consoleにアクセスし、BigQueryを有効化する必要があります。これにより、BigQueryの機能を全て利用できるようになります。プロジェクトの作成も忘れずに行いましょう。プロジェクトは、リソースやAPIの論理的なグループとして機能します。

なお、Google Cloudアカウントの作成時には、セキュリティに十分注意を払う必要があります。多要素認証を設定し、定期的にパスワードを変更するなど、基本的なセキュリティ対策を怠らないようにしましょう。BigQueryで扱うデータは貴重な資産ですから、アカウントの管理は慎重に行うべきです。

BigQueryコンソールの操作方法

BigQueryコンソールは、Webブラウザを通じてBigQueryを操作するためのインターフェースです。ここでは、データセットの作成、テーブルの管理、クエリの実行など、BigQueryの主要な操作を全て行うことができます。コンソールの使い方に慣れることで、BigQueryの機能を最大限に活用できるようになります。

コンソールの左側にはナビゲーションメニューがあり、プロジェクト、データセット、テーブルなどの階層構造を簡単に把握できます。中央部分はクエリエディタとなっており、ここでSQLクエリを記述し実行することができます。また、右側には実行結果や詳細情報が表示されます。

BigQueryコンソールの特筆すべき機能の一つに、クエリの自動補完があります。これにより、テーブル名やカラム名を正確に覚えていなくても、効率的にクエリを作成することができます。また、クエリの実行計画を視覚化する機能も備えており、パフォーマンスのボトルネックを特定するのに役立ちます。

CLIコマンドラインでの操作

コマンドラインインターフェース（CLI）を使用してBigQueryを操作することも可能です。これは、自動化やスクリプト作成、バッチ処理などに適しています。Google Cloud SDKをインストールすることで、「bq」コマンドを使ってBigQueryの様々な操作を行えるようになります。

例えば、「bq query」コマンドを使用すれば、コマンドラインから直接SQLクエリを実行できます。「bq load」コマンドでデータのロードを、「bq extract」コマンドでデータのエクスポートを行うことができます。これらのコマンドは、パイプラインの構築やバッチ処理の自動化に非常に有用です。

CLIの利点は、操作の再現性が高いことです。実行したコマンドを記録しておけば、同じ操作を何度でも正確に再現できます。また、シェルスクリプトと組み合わせることで、複雑なデータ処理フローを自動化することも可能です。BigQueryを本格的に活用する上で、CLIの使い方を習得することは大きな武器となるでしょう。

APIとクライアントライブラリの活用

BigQueryは豊富なAPIを提供しており、様々なプログラミング言語からBigQueryの機能にアクセスすることができます。これにより、既存のアプリケーションにBigQueryの分析機能を組み込んだり、カスタムのデータパイプラインを構築したりすることが可能になります。

Googleは主要なプログラミング言語向けにクライアントライブラリを提供しています。例えば、Python、Java、Go、Node.js、Ruby、PHP、C#などがサポートされています。これらのライブラリを使用することで、APIの低レベルな詳細を気にすることなく、BigQueryの機能を簡単に利用できます。

APIとクライアントライブラリを活用することで、BigQueryをより柔軟に、より深く活用することができます。例えば、リアルタイムデータ分析システムの構築や、機械学習モデルとBigQueryを組み合わせた予測分析など、高度なデータ活用が可能になります。ただし、APIの利用にはクォータやレート制限があるため、それらを考慮したアプリケーション設計が必要です。

BigQueryの構成要素

データセット

BigQueryにおいて、データセットは最上位の組織単位です。これは従来のデータベース管理システムにおけるスキーマに相当します。データセットは、テーブルやビューなどのオブジェクトをグループ化し、アクセス制御の単位としても機能します。

データセットの作成時には、地理的な位置を指定する必要があります。これにより、データの保存場所を制御し、データの主権やコンプライアンスの要件を満たすことができます。例えば、EUのGDPR規制に対応するため、データをEU圏内に保存するといった対応が可能です。

また、データセットレベルでのアクセス制御も重要な機能です。特定のユーザーやグループに対して、データセット全体へのアクセス権限を付与したり、制限したりすることができます。これにより、セキュリティとデータガバナンスを効果的に管理することが可能になります。

テーブル

テーブルは、BigQueryにおけるデータ保存の基本単位です。各テーブルは行と列で構成され、スキーマによってその構造が定義されます。BigQueryは、構造化データだけでなく、半構造化データ（JSONやAvroなど）も扱うことができ、これにより柔軟なデータモデリングが可能になっています。

BigQueryのテーブルには、通常のテーブルの他に、外部テーブルという概念も存在します。外部テーブルは、BigQuery外部のストレージ（例えばCloud Storage）に保存されているデータを参照するテーブルです。これにより、データを移動させることなく分析を行うことができます。

テーブルの管理においては、パーティショニングとクラスタリングという概念が重要です。パーティショニングは、特定のカラムに基づいてデータを物理的に分割する機能で、大規模なテーブルのクエリパフォーマンスを向上させます。クラスタリングは、関連するデータを物理的に近接して配置する機能で、特定の条件でのデータ検索を高速化します。

ビュー

ビューは、SQLクエリの結果を仮想的なテーブルとして定義したものです。実際のデータは保存せず、クエリ定義だけを保持します。ビューは、複雑なクエリをシンプル化したり、データのサブセットにアクセスを制限したりする場合に非常に有用です。

BigQueryのビューは、セキュリティの観点からも重要な役割を果たします。例えば、センシティブな情報を含むカラムを除外したビューを作成し、特定のユーザーグループにはそのビューへのアクセスのみを許可するといった使い方が可能です。これにより、必要最小限の情報へのアクセスを実現し、データのセキュリティを強化できます。

また、ビューを活用することで、データモデルの抽象化やレポーティングの標準化も実現できます。共通で使用される複雑な集計ロジックをビューとして定義しておけば、それを基にした分析やレポート作成が容易になります。ビューの適切な活用は、BigQueryを使ったデータ分析の効率を大きく向上させる鍵となります。

マテリアライズド・ビュー

マテリアライズド・ビューは、通常のビューと異なり、クエリ結果を物理的に保存する機能です。これにより、頻繁に実行される複雑なクエリの結果をキャッシュし、パフォーマンスを大幅に向上させることができます。BigQueryは自動的にマテリアライズド・ビューを最新の状態に保つため、ユーザーは常に最新のデータにアクセスできます。

マテリアライズド・ビューの利用は、特に大規模なデータセットに対する集計や結合操作を含むクエリで効果を発揮します。例えば、日次の売上集計など、定期的に実行される重い処理をマテリアライズド・ビューとして定義しておけば、クエリ実行時間を大幅に短縮できます。

ただし、マテリアライズド・ビューには追加のストレージコストがかかるため、使用する際はコストとパフォーマンスのバランスを考慮する必要があります。また、全てのクエリでマテリアライズド・ビューが使用できるわけではなく、一定の制約があることにも注意が必要です。適切な使用シナリオを見極めることが、効果的な活用のポイントとなります。

ルーティン（ストアド・プロシージャ、UDF、テーブル関数）

BigQueryは、ルーティンと呼ばれる再利用可能なコード単位をサポートしています。これには、ストアド・プロシージャ、ユーザー定義関数（UDF）、テーブル関数が含まれます。これらの機能を活用することで、複雑なロジックをカプセル化し、クエリの可読性と再利用性を高めることができます。

ユーザー定義関数（UDF）は、SQLやJavaScriptで記述できる関数で、クエリ内で使用することができます。例えば、複雑な計算ロジックや文字列操作をUDFとして定義しておけば、それを様々なクエリで再利用できます。これにより、コードの重複を避け、メンテナンス性を向上させることができます。

テーブル関数は、テーブルを返す関数で、FROM句で使用することができます。これにより、動的なデータ生成や複雑なデータ変換処理をクエリの一部として実行することが可能になります。BigQueryのこれらの機能を適切に活用することで、より柔軟で効率的なデータ処理を実現できるのです。

ジョブ

BigQueryにおけるジョブは、長時間実行される可能性のある操作を管理するための仕組みです。主なジョブタイプには、クエリジョブ、ロードジョブ、エクスポートジョブ、コピージョブなどがあります。これらのジョブは非同期で実行され、その進行状況や結果を後から確認することができます。

例えば、大規模なデータセットに対するクエリを実行する場合、即時に結果が返ってこない可能性があります。このような場合、クエリジョブとして実行することで、バックグラウンドで処理を進めながら、他の作業を続けることができます。ジョブIDを使って後からジョブの状態を確認し、完了後に結果を取得することが可能です。

また、BigQueryは自動的にジョブの履歴を保持します。これにより、過去に実行したジョブの詳細（実行時間、処理されたデータ量など）を確認することができ、パフォーマンスチューニングやコスト最適化に役立てることができます。ジョブ管理機能を適切に活用することで、BigQueryの運用効率を大幅に向上させることが可能となります。

データの取り込み方法

バッチロード

バッチロードは、大量のデータをBigQueryに一括で取り込む方法です。これは、定期的なデータ更新や初期データロードなどのシナリオで特に有用です。BigQueryは、CSV、JSON、Avro、Parquetなど、多様なファイル形式をサポートしているため、既存のデータをほぼそのまま取り込むことができます。

バッチロードの実行方法は複数あります。BigQueryコンソールからのGUIベースの操作、「bq load」コマンドを使用したCLIからの操作、そしてクライアントライブラリを使用したプログラムからの操作などが可能です。大規模なデータセットの場合、Cloud Storageを経由してデータをロードするのが一般的です。これにより、ネットワークの切断などの問題に対する耐性が向上します。

バッチロード時には、スキーマの自動検出機能を利用することもできます。これにより、データファイルの内容からBigQueryが自動的にスキーマを推論し、テーブルを作成します。ただし、より厳密なデータ制御が必要な場合は、明示的にスキーマを定義することをお勧めします。適切なバッチロード戦略を立てることで、BigQueryへのデータ取り込みを効率的に行うことができます。

ストリーミングデータのロード

ストリーミングデータのロードは、リアルタイムでデータをBigQueryに取り込む方法です。これにより、データが生成されるとほぼ同時に分析可能になるため、リアルタイム分析やリアルタイムダッシュボードの構築などに非常に有効です。BigQueryのストリーミング挿入APIを使用することで、1秒あたり最大100,000行のデータを取り込むことができます。

ストリーミングデータのロードは、主にプログラムから行います。Pythonや Java、Go言語などのクライアントライブラリを使用して、アプリケーションからBigQueryにデータをストリーミングできます。また、Google Cloud PubSubと組み合わせることで、より堅牢なストリーミングデータパイプラインを構築することも可能です。

ただし、ストリーミングデータのロードにはいくつかの注意点があります。まず、コストが比較的高くなる傾向があります。また、ストリーミングで挿入されたデータは、バッファに保存されてから実際のテーブルに書き込まれるため、クエリ結果に即時反映されない場合があります。これらの特性を理解した上で、適切なユースケースでストリーミングデータのロードを活用することが重要です。

データの分析とクエリ

GoogleSQLによるクエリの実行

BigQueryでは、GoogleSQLと呼ばれるSQL方言を使用してデータの分析とクエリを行います。GoogleSQLは、ANSI SQL 2011規格に準拠しており、多くのSQLユーザーにとって馴染みやすい言語です。同時に、BigQuery特有の機能や最適化のための拡張も含まれています。

GoogleSQLの特徴的な機能の一つに、ARRAYやSTRUCT型のサポートがあります。これらを使用することで、複雑なデータ構造を効率的に扱うことができます。また、ウィンドウ関数やANALYTIC関数など、高度な分析に必要な機能も豊富に用意されています。これらの機能を駆使することで、複雑なビジネスロジックを単一のSQLクエリで表現することが可能になります。

BigQueryでは、テラバイトやペタバイト規模のデータに対しても高速にクエリを実行できます。この背景には、BigQueryの分散処理アーキテクチャがあります。ユーザーは複雑なクラスタ管理を意識する必要はなく、シンプルにSQLを記述するだけで、大規模データの高速分析が可能になるのです。ただし、効率的なクエリ実行のためには、適切なクエリ最適化技法を理解し適用することが重要です。

クエリ結果のキャッシュとドライラン

BigQueryには、クエリ結果のキャッシュ機能があります。同一のクエリが短時間内に再実行された場合、前回の結果がキャッシュから返されるため、処理時間とコストを大幅に削減できます。このキャッシュは24時間保持され、デフォルトで有効になっています。ただし、データの鮮度が重要な場合は、キャッシュを無効にすることも可能です。

一方、ドライランは、クエリを実際に実行せずに、処理されるデータ量を推定する機能です。これにより、クエリの実行前にコストを見積もることができます。BigQueryのコストはプロセス済みバイト数に基づいて計算されるため、ドライランは予算管理のための重要なツールとなります。

キャッシュとドライランを適切に活用することで、BigQueryの運用をより効率的かつ経済的に行うことができます。例えば、開発段階でのクエリテストにはキャッシュを活用し、本番環境での重要な分析ではキャッシュを無効にするといった使い分けが可能です。また、大規模なデータ処理を行う前にドライランを実行し、予想外のコスト発生を防ぐことができます。

パラメータ化クエリ

パラメータ化クエリは、BigQueryの強力な機能の一つです。これにより、クエリの一部を変数として定義し、実行時に値を指定することができます。パラメータ化クエリを使用することで、クエリの再利用性が高まり、動的なクエリ生成が容易になります。

例えば、日付範囲を指定してデータを抽出するクエリがあるとします。この日付をパラメータ化することで、同じクエリ構造を維持したまま、異なる日付範囲で繰り返し実行することができます。これにより、クエリの管理が容易になり、誤入力のリスクも減少します。

パラメータ化クエリは、セキュリティの観点からも重要です。SQLインジェクション攻撃のリスクを軽減し、よりセキュアなアプリケーション開発を可能にします。また、クエリのパフォーマンス最適化の観点からも有用で、クエリプランのキャッシュを効果的に活用できます。BigQueryを本格的に活用する上で、パラメータ化クエリの使用は必須のスキルと言えるでしょう。

BigQueryの料金体系

ストレージ料金

BigQueryのストレージ料金は、保存されているデータ量に基づいて計算されます。料金は、アクティブストレージと長期保存ストレージの2種類に分かれています。アクティブストレージは、直近90日以内に変更またはストリーミング挿入されたデータを指し、長期保存ストレージは90日以上変更されていないデータを指します。

2024年7月現在、アクティブストレージの料金は1TBあたり月額約20ドル、長期保存ストレージは約10ドルとなっています。この料金体系により、頻繁に使用されないデータのコストを抑えることができます。ただし、これらの料金は地域によって若干異なる場合があります。

ストレージコストを最適化するためには、不要なデータの削除や、パーティショニングの活用が効果的です。例えば、日付でパーティショニングしたテーブルを作成し、古いパーティションを定期的に削除することで、ストレージコストを抑えつつ、必要なデータへの高速アクセスを維持することができます。

コンピュート料金

BigQueryのコンピュート料金は、クエリによって処理されたデータ量に基づいて計算されます。2024年7月現在、1TBあたり約5ドルの料金が設定されています。この料金体系では、クエリの効率性が直接コストに影響します。つまり、同じ結果を得るためにより少ないデータを処理するクエリを書くことで、コストを削減できます。

BigQueryには、オンデマンド料金と定額料金の2つの価格モデルがあります。オンデマンド料金は、使用した分だけ支払う方式で、変動的な使用パターンに適しています。一方、定額料金は、一定のスロットを予約する方式で、大規模で安定した使用パターンに適しています。

コンピュート料金を最適化するためには、クエリの最適化が重要です。例えば、必要な列のみを選択する、適切なフィルタリングを行う、効率的なジョインを使用するなどの方法があります。また、マテリアライズド・ビューを活用することで、頻繁に実行される複雑なクエリのコストを大幅に削減することも可能です。

無料枠と従量課金

BigQueryは、一定の無料枠を提供しています。2024年7月現在、毎月10GBのストレージと1TBのクエリ処理が無料で利用できます。この無料枠は、小規模なプロジェクトや学習目的での利用に適しています。無料枠を超えた使用分に対しては、従量課金が適用されます。

従量課金制度により、ユーザーは使用した分だけ支払えばよく、初期投資や最低利用料金などの縛りがありません。これにより、ビジネスの成長に合わせて柔軟にスケールアップすることが可能です。ただし、予期せぬ高額請求を避けるためには、適切な予算管理と監視が必要です。

BigQueryには、予算超過を防ぐためのクォータ設定機能があります。例えば、1日あたりのクエリ処理量に上限を設定することができます。また、前述のドライラン機能を活用して、大規模なクエリの実行前にコストを見積もることも重要です。これらの機能を適切に利用することで、コストを予測可能な範囲に抑えつつ、BigQueryの強力な機能を最大限に活用することができます。

BigQueryと他のGoogle Cloudサービスとの連携

Cloud Storageとの連携

BigQueryはGoogle Cloud Storageと緊密に連携しており、この組み合わせにより大規模なデータ分析パイプラインを効率的に構築できます。Cloud Storageは、構造化・非構造化データを問わず、あらゆる種類のデータを保存できる高度なオブジェクトストレージサービスです。BigQueryとCloud Storageを連携させることで、データの保存と分析を seamlessに行うことが可能になります。

例えば、大量のログファイルをCloud Storageに保存し、BigQueryの外部テーブル機能を使ってそのデータを直接クエリすることができます。これにより、データを移動させることなく分析が可能になり、ストレージコストとデータ転送時間を削減できます。また、BigQueryのクエリ結果をCloud Storageにエクスポートすることも可能で、他のシステムとのデータ連携にも活用できます。

さらに、Cloud Storageを中間ステージとして利用することで、大規模なデータのバッチロードも効率的に行えます。例えば、オンプレミスのデータをまずCloud Storageにアップロードし、そこからBigQueryにロードするという流れです。この方法は、ネットワークの切断などのリスクを軽減し、より確実なデータ転送を実現します。

Cloud SQLおよびCloud Spannerとの連携

BigQueryは、GoogleのマネージドリレーショナルデータベースサービスであるCloud SQLやCloud Spannerとも連携が可能です。これらのサービスは、トランザクション処理に特化しているため、BigQueryとの組み合わせによりOLTP（オンライントランザクション処理）とOLAP（オンライン分析処理）の両方をカバーする総合的なデータ基盤を構築できます。

例えば、日々の取引データをCloud SQLで管理し、定期的にBigQueryに転送して大規模な分析を行うといった使い方が考えられます。BigQueryは外部データソース連携機能を持っているため、Cloud SQLやCloud Spannerのデータを直接クエリすることも可能です。これにより、リアルタイムに近い形でトランザクションデータの分析が行えます。

また、BigQueryのクエリ結果をCloud SQLやCloud Spannerに書き戻すこともできます。例えば、BigQueryで複雑な集計や機械学習モデルによる予測を行い、その結果をCloud SQLに保存して高速な参照を可能にするといった使い方です。このように、各サービスの特性を活かした柔軟なデータ活用が実現できます。

Pub/Subとの連携

Google Cloud Pub/Subは、メッセージングサービスであり、BigQueryとの連携により、リアルタイムデータ分析パイプラインを構築できます。Pub/Subは、大量のイベントデータを高速かつ信頼性高く伝達する能力を持っており、BigQueryのストリーミング挿入機能と組み合わせることで、リアルタイムデータ処理を実現します。

典型的なユースケースとしては、IoTデバイスからのセンサーデータや、ウェブサイトのクリックストリームデータなどをPub/Subで受け取り、BigQueryにストリーミング挿入するというものがあります。これにより、データが生成されてから数秒以内に分析可能な状態になります。BigQueryのストリーミングバッファを活用することで、大量のデータを効率的に取り込むことができます。

さらに、BigQueryのクエリ結果をPub/Subに発行することも可能です。例えば、異常検知のロジックをBigQueryで実装し、異常が検出された場合にPub/Subを通じてアラートを発行するといった使い方ができます。このように、Pub/SubとBigQueryの連携により、リアルタイムデータ処理と分析の両方を兼ね備えた高度なデータパイプラインを構築することが可能となります。

セキュリティとガバナンス

IAMによるアクセス制御

Google Cloud Identity and Access Management (IAM) は、BigQueryのセキュリティを管理する上で中心的な役割を果たします。IAMを使用することで、誰が何をできるかを細かく制御できます。例えば、特定のユーザーに対して、データの読み取りのみを許可し、書き込みや削除は禁止するといった設定が可能です。

BigQueryでは、プロジェクト、データセット、テーブルの各レベルでIAMポリシーを設定できます。これにより、組織の階層構造やデータの重要度に応じた柔軟なアクセス制御が可能になります。例えば、マーケティング部門には売上データへの読み取りアクセスのみを許可し、財務部門にはフルアクセスを与えるといった具合です。

また、IAMには事前定義されたロールが用意されており、一般的なユースケースに対応しています。例えば、「BigQuery閲覧者」「BigQueryデータ編集者」「BigQuery管理者」などです。これらの事前定義ロールを使用することで、セキュリティ設定の負担を軽減できます。さらに、カスタムロールを作成することも可能で、組織固有の要件に応じたきめ細かいアクセス制御を実現できます。

列レベル・行レベルのセキュリティ

BigQueryは、列レベルおよび行レベルのセキュリティ機能を提供しており、これによりデータのきめ細かな保護が可能になります。列レベルのセキュリティでは、特定の列へのアクセスを制限することができます。例えば、個人情報を含む列へのアクセスを特定のユーザーグループのみに制限するといった使い方ができます。

一方、行レベルのセキュリティでは、条件に基づいて特定の行へのアクセスを制御できます。例えば、営業担当者が自分の担当地域のデータのみにアクセスできるようにするといった設定が可能です。これらの機能を使用することで、同じテーブル内でもユーザーごとに異なるデータビューを提供できます。

これらのセキュリティ機能は、ポリシータグと呼ばれる仕組みを使って実装されます。ポリシータグを列や行に適用し、そのタグに対するアクセス権限をIAMで管理することで、柔軟かつ強力なデータ保護を実現できます。この機能により、データのセキュリティを確保しつつ、必要な情報へのアクセスを効率的に提供することが可能になります。

デフォルトの暗号化およびCMEK

BigQueryでは、保存されているすべてのデータがデフォルトで暗号化されます。この暗号化は、Google管理の暗号鍵を使用して自動的に行われるため、ユーザーは特別な設定を行う必要がありません。これにより、データの機密性が高いレベルで保護されます。

さらに高度なセキュリティ要件がある場合、顧客管理の暗号鍵（Customer-Managed Encryption Keys, CMEK）を使用することができます。CMEKを使用すると、暗号化に使用する鍵を自社で管理できるようになります。これにより、鍵の回転や削除といった操作を自社のポリシーに基づいて行うことが可能になります。

CMEKの使用には、Google Cloud Key Management Service (KMS) との連携が必要です。KMSで生成した鍵をBigQueryのデータセットに関連付けることで、そのデータセット内のすべてのデータがCMEKで暗号化されます。この機能は、特に金融業界や医療業界など、厳格なコンプライアンス要件がある業界で重要です。CMEKを使用することで、データの暗号化に関する完全な制御を得ることができ、セキュリティとコンプライアンスの両面でより高度な要件に対応することが可能になります。

BigQueryの高可用性と耐久性

データの複製とバックアップ

BigQueryは、高い可用性と耐久性を実現するために、データの自動複製を行っています。デフォルトでは、すべてのデータが地理的に分散した複数のデータセンターに冗長的に保存されます。これにより、単一のデータセンターで障害が発生した場合でも、データの可用性が維持されます。

また、BigQueryは自動的にスナップショットバックアップを作成します。これらのスナップショットは7日間保持され、誤ってデータを削除した場合などに復元が可能です。ただし、この機能はデータの完全な保護を保証するものではないため、重要なデータに関しては追加のバックアップ戦略を検討する必要があります。

さらに、ユーザーが明示的にバックアップを作成することも可能です。例えば、テーブルのコピーを作成したり、データをCloud Storageにエクスポートしたりすることで、より長期的なバックアップを実現できます。これらの機能を組み合わせることで、データの安全性をさらに高めることができます。

タイムトラベル機能

BigQueryのタイムトラベル機能は、過去7日間のデータ状態にアクセスできる強力な機能です。この機能により、誤ってデータを削除したり、不適切な更新を行ったりした場合でも、簡単に元の状態に戻すことができます。タイムトラベルは、データの復元だけでなく、時系列分析にも活用できる有用な機能です。

タイムトラベルを使用するには、SQLクエリでTIMESTAMP句を指定します。例えば、「2日前の午後3時のデータ状態を参照する」といったクエリが可能です。この機能は、データの変更履歴を追跡したり、特定の時点のスナップショットを取得したりする際に非常に便利です。

ただし、タイムトラベル機能はストレージコストに影響を与える点に注意が必要です。過去7日間のデータ状態を保持するため、ストレージ使用量が増加します。そのため、コストとデータの重要性のバランスを考慮しながら、この機能を活用することが重要です。

フェイルセーフと災害対策

BigQueryは、Googleのグローバルインフラストラクチャを活用して、高度なフェイルセーフ機能と災害対策を提供しています。データは常に複数の地理的に分散したロケーションに保存されるため、単一の障害点がなく、高い信頼性を確保しています。

さらに、BigQueryは自動的にフェイルオーバーを実行します。例えば、あるデータセンターで障害が発生した場合、自動的に他のデータセンターにトラフィックが切り替わります。この過程はユーザーに対して透過的に行われ、サービスの中断を最小限に抑えます。

大規模な災害に備えて、地域をまたいだデータのレプリケーションも可能です。例えば、米国のデータをヨーロッパにレプリケートするといった設定ができます。これにより、地域全体が影響を受けるような大規模災害が発生した場合でも、データの可用性を維持することができます。ただし、このような高度な災害対策を実施する場合は、データの主権やプライバシー法制の問題を考慮する必要があります。BigQueryのこれらの機能を適切に活用することで、ビジネスクリティカルなデータの保護と継続性を確保することができます。

データのエクスポート方法

Cloud Storageへのエクスポート

BigQueryからCloud Storageへのデータエクスポートは、大規模なデータセットを効率的に移動させる方法として広く利用されています。このプロセスは、BigQueryコンソール、コマンドラインインターフェース（CLI）、またはAPIを通じて実行できます。エクスポートされたデータは、CSV、JSON、Avro、Parquetなど、様々な形式で保存することが可能です。

例えば、クエリ結果を長期保存したい場合や、他のシステムでデータを利用したい場合に、Cloud Storageへのエクスポートが有効です。エクスポートジョブは非同期で実行されるため、大規模なデータセットでも効率的に処理できます。また、エクスポート先のCloud Storageバケットを適切に設定することで、データの地理的な配置やアクセス制御を細かく管理することができます。

ただし、エクスポート時には一定の制限があることに注意が必要です。例えば、単一のエクスポートジョブで処理できるデータ量に上限があります。大規模なデータセットをエクスポートする場合は、データを適切に分割してエクスポートするなどの工夫が必要になることがあります。BigQueryとCloud Storageの連携を上手く活用することで、柔軟なデータ管理と分析が可能になります。

ローカルPCへのダウンロード

BigQueryからローカルPCへのデータダウンロードは、小規模なデータセットや迅速なデータ確認が必要な場合に便利な機能です。BigQueryコンソールを使用すると、クエリ結果を直接CSVやJSONファイルとしてダウンロードすることができます。また、Google SheetsやMicrosoft Excelなどの表計算ソフトにデータを直接エクスポートする機能も用意されています。

ただし、ローカルPCへのダウンロードには制限があります。例えば、コンソールからダウンロードできるデータ量には上限があり、通常は数GBまでとなっています。また、大量のデータをローカルPCにダウンロードすることは、ネットワーク帯域やストレージの観点から効率的ではない場合があります。

セキュリティの観点からも、センシティブなデータをローカルPCにダウンロードする際には注意が必要です。組織のデータ保護ポリシーに従い、適切なセキュリティ対策（暗号化、アクセス制限など）を講じる必要があります。大規模なデータセットや頻繁なデータ転送が必要な場合は、Cloud Storageを経由したエクスポートや、専用のデータ転送ツールの利用を検討するべきでしょう。

BigQueryのパフォーマンス最適化

パーティショニングとクラスタリング

BigQueryのパーティショニングとクラスタリングは、クエリパフォーマンスを大幅に向上させる重要な機能です。パーティショニングは、特定のカラム（通常は日付やタイムスタンプ）に基づいてデータを物理的に分割します。これにより、クエリが必要なデータのみをスキャンし、不要なデータの読み取りを避けることができます。例えば、過去30日分のデータのみを分析する場合、パーティショニングされたテーブルでは該当する30日分のパーティションのみが処理されます。

一方、クラスタリングは、指定したカラムの値に基づいてデータを並べ替えて保存する機能です。これにより、特定の条件に基づくデータの検索や集計が高速化されます。例えば、顧客IDでクラスタリングされたテーブルでは、特定の顧客に関するデータを効率的に取得できます。パーティショニングとクラスタリングを組み合わせることで、さらに高度なパフォーマンス最適化が可能になります。

ただし、パーティショニングとクラスタリングの設計には注意が必要です。適切なカラムの選択、パーティションの粒度、クラスタリングの順序などを、実際のクエリパターンに基づいて慎重に検討する必要があります。また、これらの機能はストレージコストにも影響を与える可能性があるため、パフォーマンスとコストのバランスを考慮することが重要です。

Search Indexの利用

BigQueryのSearch Index機能は、特定のカラムに対する検索処理を大幅に高速化します。この機能は、主に文字列データに対する部分一致や前方一致などの検索操作に効果を発揮します。Search Indexを利用することで、従来のフルスキャンによる検索と比較して、クエリの実行時間とコストを大幅に削減できます。

例えば、商品名や顧客名といった文字列データに対して頻繁に検索を行うユースケースでは、Search Indexの活用が有効です。インデックスを作成することで、「特定の文字列を含む行を高速に抽出する」といった操作が効率化されます。これは特に、大規模なデータセットに対して部分一致検索を行う場合に顕著な効果を発揮します。

ただし、Search Indexの利用にはいくつかの考慮点があります。インデックスの作成と維持にはコストがかかるため、頻繁に使用される検索パターンに対してのみ適用するべきです。また、インデックスの更新はバックグラウンドで非同期に行われるため、最新のデータが即座にインデックスに反映されない場合があることに注意が必要です。Search Indexを適切に活用することで、BigQueryの検索性能を大幅に向上させ、より効率的なデータ分析を実現できます。

データパイプラインとELTの実装

BigQuery Data Transfer Service

BigQuery Data Transfer Serviceは、様々なソースからBigQueryへのデータ転送を自動化するサービスです。このサービスを利用することで、Google AnalyticsやGoogle Ads、YouTubeなどのGoogleサービスからのデータ転送はもちろん、Amazon S3やTeradata、Oracleなどの外部ソースからのデータ転送も効率的に行うことができます。

Data Transfer Serviceの主な利点は、データ転送プロセスの自動化にあります。定期的なスケジュールを設定することで、データの更新を自動的に行うことができます。これにより、手動でのデータ更新作業が不要になり、常に最新のデータを分析に利用できるようになります。また、転送プロセスの監視やエラー通知機能も提供されており、データ転送の信頼性を高めることができます。

ただし、Data Transfer Serviceの利用には一定の制約があることに注意が必要です。例えば、転送可能なデータ量や転送頻度に制限がある場合があります。また、すべてのデータソースがサポートされているわけではないため、利用前に対象のデータソースがサポートされているかを確認する必要があります。Data Transfer Serviceを適切に活用することで、効率的で信頼性の高いデータパイプラインを構築することが可能になります。

スケジュールされたクエリ

BigQueryのスケジュールされたクエリ機能は、定期的なデータ処理や更新を自動化する強力なツールです。この機能を使用することで、特定のSQLクエリを指定した間隔で自動的に実行し、その結果を新しいテーブルに書き込んだり、既存のテーブルを更新したりすることができます。これは、日次の集計処理や週次のレポート生成など、繰り返し行われるデータ処理タスクに特に有効です。

スケジュールされたクエリの利点は、人間の介入なしに定期的なデータ処理を実行できることです。例えば、毎日午前2時に前日のデータを集計し、集計テーブルを更新するといったタスクを自動化できます。これにより、データアナリストやエンジニアは、繰り返しの作業から解放され、より価値の高い分析や開発に集中することができます。

ただし、スケジュールされたクエリを設定する際は、いくつかの点に注意が必要です。まず、クエリの実行時間とコストを考慮し、適切なスケジュール間隔を設定する必要があります。また、クエリが失敗した場合の対応策（再試行設定やアラート通知など）も検討すべきです。さらに、スケジュールされたクエリの結果によって更新されるテーブルへのアクセス権限管理も重要です。これらの点に注意しながらスケジュールされたクエリを活用することで、効率的かつ信頼性の高いデータパイプラインを構築することができます。

Dataformの活用

Dataformは、BigQueryを中心としたデータウェアハウスの開発と管理を効率化するためのツールです。SQLベースのワークフロー管理とバージョン管理を組み合わせることで、複雑なデータ変換処理やETL（Extract, Transform, Load）プロセスを効率的に実装し、管理することができます。

Dataformの主な特徴は、SQLをベースとしたデータ定義言語（SQLX）を使用することです。これにより、データエンジニアやアナリストは、慣れ親しんだSQLの知識を活かしながら、より高度なデータパイプラインを構築することができます。また、依存関係の自動管理機能により、複雑なデータ変換の順序を正確に制御することが可能です。

さらに、Dataformはバージョン管理システム（Git）との統合を提供しており、データパイプラインの変更履歴を追跡し、チーム間での協力を促進することができます。これは特に、大規模なデータプロジェクトや複数のチームが関わるプロジェクトで重要です。テスト機能も備えており、データ品質の確保や、変更による影響の事前確認が可能です。

ただし、Dataformの導入には一定の学習コストがかかることに注意が必要です。SQLXの文法や、Dataformの概念（アサーション、ドキュメンテーションなど）を理解する必要があります。また、既存のETLプロセスをDataformに移行する際には、慎重な計画と段階的なアプローチが求められます。Dataformを適切に活用することで、より管理しやすく、スケーラブルなデータパイプラインを構築することが可能になり、データ駆動型の意思決定をより効果的にサポートすることができます。

エンジニア、PM、デザイナーの副業・転職採用サービス「Offers（オファーズ）」では、非公開求人を含む豊富なIT・Web業界の転職・副業情報を提供しています。高年収の求人・高時給の案件や最新技術スタックを扱う企業など、あなたのスキルを最大限に活かせるポジションが見つかります。専任のキャリアアドバイザーが、入社日調整や条件交渉をきめ細かくサポート。転職・正社員求人、副業・業務委託案件、募集をお探しの方はOffersまでご相談ください。

BigQuery×東京都の採用・求人一覧

検索結果

データの力で究極の適材適所を実現するシニアデータサイエンティスト募集

ユーザーがまだ気づいていない価値を生み出すプロダクトマネージャー募集

過去と未来と向き合いサービスを成長させるバックエンドエンジニア募集！

メンバーの能力を引き出し持続的に成長する組織を作るエンジニアリングマネージャー

SaaSプロダクト｜ユーザービリティ向上とDX向上を担うフロントエンジニア募集！

【フルリモート/SaaS自社サービス】エンジニアリングマネージャー

【フルリモート/SaaS自社サービス】SRE&インフラエンジニア

【フルリモート/SaaS自社サービス】WEBアプリケーションエンジニア

グローバル成長を支える！TimeTreeのBackendエンジニア募集

6.5億調達済/437億データ/データで働き方を変革するデータ統括（CTO候補）

6.5億調達済/データベース技術で働き方を変革！データエンジニア/437億データ

6.5億調達済/データ技術で働き方を変えるデータサイエンティスト！437億データ

【Fintech】テックリード（フロントエンドエンジニア）

【Fintech】フロントエンドエンジニア

【Ruby】月間ユーザー3000万以上のサービスを支えるバックエンドエンジニア

【副業スタート可】SaaS TROCCO®ソフトウェアエンジニア（リモート可）

リードエンジニア／テックリード

【Fintech】フルスタックエンジニア

【Fintech】バックエンドエンジニア

【Fintech】QAエンジニア

職種から求人を探す

開発言語から探す

年収・時給から探す

[時給]1,000円~

[時給]2,000円~

[時給]3,000円~

[時給]4,000円~

[時給]5,000円~

[年収]300万円~

[年収]400万円~

[年収]500万円~

[年収]600万円~

[年収]700万円~

[年収]800万円~

[年収]900万円~

稼働時間から探す

週1日~（週8時間~）

週2日~（週16時間~）

週3日~（週24時間~）

週4日~（週32時間~）

週5日~（週40時間~）