Fields of Gold: Scraping Web Data for Marketing Insights

计算机科学 数据科学 网络智能 数据收集 网络标准 数据网 万维网 互联网 类型学 网络工程 Web建模 网页 社会学 人类学 社会科学
作者
Johannes Boegershausen,Hannes Datta,Abhishek Borah,Andrew T. Stephen
出处
期刊:Journal of Marketing [SAGE Publishing]
卷期号:86 (5): 1-20 被引量:72
标识
DOI:10.1177/00222429221100750
摘要

Marketing scholars increasingly use web scraping and application programming interfaces (APIs) to collect data from the internet. Yet, despite the widespread use of such web data, the idiosyncratic and sometimes insidious challenges in its collection have received limited attention. How can researchers ensure that the data sets generated via web scraping and APIs are valid? While existing resources emphasize technical details of extracting web data, the authors propose a novel methodological framework focused on enhancing its validity. In particular, the framework highlights how addressing validity concerns requires the joint consideration of idiosyncratic technical and legal/ethical questions along the three stages of collecting web data: selecting data sources, designing the data collection, and extracting the data. The authors further review more than 300 articles using web data published in the top five marketing journals and offer a typology of how web data have advanced marketing thought. The article concludes with directions for future research to identify promising web data sources and embrace novel approaches for using web data to capture and describe evolving marketplace realities.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
徐捷宁完成签到,获得积分10
刚刚
xiong完成签到 ,获得积分10
刚刚
小宝发布了新的文献求助10
2秒前
简单完成签到,获得积分10
3秒前
阔达幻丝发布了新的文献求助20
3秒前
6秒前
7秒前
nannan完成签到,获得积分10
8秒前
9秒前
Nicole完成签到 ,获得积分10
9秒前
明天就爆炸完成签到,获得积分10
9秒前
10秒前
共享精神应助YZ采纳,获得30
10秒前
来来来完成签到,获得积分10
11秒前
宇文傲龙完成签到,获得积分0
12秒前
滴滴哩哩完成签到,获得积分10
12秒前
12秒前
停停走走完成签到,获得积分10
12秒前
甜甜戎发布了新的文献求助10
14秒前
14秒前
fengqicyclo完成签到,获得积分20
14秒前
remedy发布了新的文献求助10
15秒前
达克赛德完成签到 ,获得积分10
16秒前
小盒关注了科研通微信公众号
16秒前
达进完成签到,获得积分20
16秒前
17秒前
18秒前
GHOMON发布了新的文献求助10
18秒前
小葡萄完成签到 ,获得积分10
18秒前
19秒前
小白想吃面包完成签到,获得积分10
20秒前
21秒前
桐桐应助达进采纳,获得10
21秒前
小石头发布了新的文献求助10
23秒前
和谐亦瑶完成签到,获得积分10
23秒前
啊萌萌发布了新的文献求助20
23秒前
科研通AI5应助GVSDLIUJ采纳,获得10
23秒前
23秒前
李健应助水泥酱采纳,获得20
23秒前
天竹子完成签到,获得积分10
24秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Conference Record, IAS Annual Meeting 1977 1250
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
APA educational psychology handbook, Vol 1: Theories, constructs, and critical issues 700
An Annotated Checklist of Dinosaur Species by Continent 500
岡本唐貴自伝的回想画集 500
Distinct Aggregation Behaviors and Rheological Responses of Two Terminally Functionalized Polyisoprenes with Different Quadruple Hydrogen Bonding Motifs 450
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3652029
求助须知:如何正确求助?哪些是违规求助? 3216168
关于积分的说明 9711094
捐赠科研通 2924027
什么是DOI,文献DOI怎么找? 1601448
邀请新用户注册赠送积分活动 754175
科研通“疑难数据库(出版商)”最低求助积分说明 732987