-
Data Crawler Staff ( Nhân Viên Thu Thập Dữ Liệu)
- CÔNG TY CỔ PHẦN WEBIFY GROUP
- Khu vực tuyển dụng: Hồ Chí Minh
- Mức lương: 12 triệu - 15 triệu
- Lượt xem: 60 . Hạn nộp hồ sơ: 11/03/2025 . Ngày duyệt: 11/02/2025
Mức lương: 12 triệu - 15 triệu
Hình thức làm việc: Toàn thời gian cố định
Địa điểm làm việc: 19 Hồ Văn Huê, P9, Q.Phú Nhuận, Thành phố Hồ Chí Minh
Số lượng: 1
Chức vụ: Nhân viên
Ngày đăng tuyển: 11/02/2025
Ngành nghề: Công nghệ thông tin
Mô tả công việc
- Design cross-platform Python crawling scripts
- Build scalable systems
- Develop parallel crawling solutions
- Manage large, multi-threaded data streams
Technologies:
- Scrapy, BeautifulSoup
- Selenium
- Asyncio, Multiprocessing
- Proxy management
- IP rotation techniques
2. Data Processing and Normalization
- Processing Methods:
- Develop API data cleaning processes
- Data transformation algorithms
- Integrity checks
- Remove noisy data
Tools:
- Pandas
- Data validation techniques
- Machine Learning preprocessing
3. Database Management
- Advanced SQL:
- Complex queries
- Performance optimization
4. Monitoring & Optimization
Strategy:
- Manage scraping system operations.
- Track scraping performance
- Challenge handling:
- IP blocking
- Speed limiting
- CAPTCHA
Quyền lợi được hưởng
-Parking allowance
-Regular annual salary increase
-Training and capacity development to meet job requirements and promotion path
-Participate in courses when necessary
-Weekly/monthly/quarterly/yearly bonuses and project bonuses
-Holiday/Tet bonuses
-Young, friendly and dynamic working environment.
-Travel: 1 time/year
Yêu cầu công việc
- Major: Data science, Computer engineering, Data related fields
- English: TOEIC > 700 of IELTS >5.5
- Technical Skills
- Python Ecosystem
- Asyncio, Multiprocessing
- Data cleaning techniques
- Machine Learning preprocessing
- Advanced error handling
- Database & Big Data
- SQL (Intermediate to Advanced)
- NoSQL database management
- PySpark
- Data warehousing
- In-depth Experience
- Minimum 1-2 years
- Project implementation
- - Web scraping
- Automatic data processing
- Big data crawling
- System analysis
- Problem solving
- Independent & team working
- Time management
- Logical thinking
- Nice to have experiences
- Big Data experience
- Data pipeline design
- Working with diverse APIs
- Professional certifications
- Creativity and initiative in proposing ideas
Yêu cầu hồ sơ
Việc làm liên quan
-
Yêu cầu giới tính
Không yêu cầu -
Bằng cấp
Cử nhân -
Kinh nghiệm
1 năm -
Ngôn ngữ
Tiếng Anh