Discovering the Structure of Knowledge in Urban Data Mining Using Vocabulary Co-occurrence Analysis

Document Type : Original Article

Authors
1 PhD Candidate, Department of Urban Planning, Faculty of Architecture and Urban Planning, Art University of Isfahan, Isfahan, Iran.
2 Associate Professor, Department of Urban Planning, Faculty of Architecture and Urban Planning, Art University of Isfahan, Isfahan, Iran.
Abstract
The co-occurrence technique of words is used to illustrate the structure of knowledge in new scientific fields. In the current study, which is development in terms of purpose and descriptive-analytical in terms of method; It is taken from the co-occurrence analysis of words for further analysis and understanding of the field of urban data mining. Therefore, in this study, the trend of scientific productions and leading authors in this field has been examined. And then the most important components of the structures of this new field of scientific articles are presented. For this purpose, 392 articles in the field of urban data mining were found after searching the reference database of Web of Science, and statistical methods and VOSviewer software were used to analyze the information of these articles. The results show that the most influential and leading country in this field is China, whose researchers have published 28 articles in the science citation database. Also, the analysis of the time course of the articles shows that this topic has been around for a decade and the more we move to the present, the growth of scientific productions in this field will increase. But the most important finding of the current research, which was obtained based on clustering analysis and knowledge map analysis, shows that the field of urban data mining has five subfields or main structural components: 1-Analysis of urban systems and smart cities, 2- Modeling and data analysis framework, 3- identifying patterns and predicting them along with visualization techniques, 4- big data and social media, 5- urban big data and traffic network; Of these, urban big data analysis is more recent than other sub-structures, and research in this field is mostly related to the years 2022 and 2023.

Keywords

Subjects


  • ابوبی اردکانی، محمد، عابدی جعفری، حسن، و آقازاده، فتاح (1389). کاربرد روش‌های خوشه‌بندی در ترسیم نقشه‌های علم: مورد کاوی نقشه‌ی علم مدیریت شهری. فصلنامه علوم و فناوری اطلاعات، 25 (3)، 371-347.

https://sid.ir/paper/478948/fa

  • احمدی، حمید، سلیمی، علی، و زنگیشه، الهه (1392). علم‌سنجی، خوشه‌بندی و نقشه دانش تولیدات علمی ادبیات تطبیقی در ایران. کاوش نامه ادبیات تطبیقی، 3 (11)، 1-28.

https://sid.ir/paper/508415/fa

  • احمدی، حمید، و کوکبی، مرتضی (1394). همایندی واژگان: مطالعه‌ای پیرامون پیوند و مرز میان مدیریت اطلاعات و مدیریت دانش بر اساس انتشارات داخلی نویسندگان ایرانی. پژوهشنامه پردازش و مدیریت اطلاعات، 30 (3)، 676-647.

https://sid.ir/paper/131043/fa

  • احمدی، حمید، و عصاره، فریده. (1396). مروری بر کارکردهای تحلیل هم واژگانی. مطالعات کتابداری و سازمان‌دهی اطلاعات ، 28(1)، 145-125.

http://noo.rs/xhnE8

  • الهی، شعبان، نقی زاده، رضا، قاضی نوری، سپهر، و منطقی، منوچهر (1391). شناسایی جریان‌های غالب در حوزه توسعه نوآوری در مناطق با استفاده از روش تحلیل هم رخدادی کلمات. فصلنامه بهبود مدیریت، 6 (3)، 136-168.

https://sid.ir/paper/478455/fa

  • توکلی زاده راوری، محمد، و نجابتیان، مریم (1389). خوشه‌بندی مبتنی بر مدرک اصطلاح: هم‌جواری موضوعات روان‌شناسی ازدواج در ادبیات زیست پزشکی در دوره‌های زمانی 1990-1999 و 2000-2008. فصلنامه مدیریت اطلاعات سلامت، 7 (2)، 186-172.

https://sid.ir/paper/121939/fa

  • ذوالفقاری، ثریا، توکلی زاده راوری، محمد، میرزایی، احمد، سهیلی، فرامرز، و سجادیان، محمد (1395). کاربرد نقشه‌های به‌دست‌آمده از تحلیل هم رخدادی واژگان پروانه‌های ثبت اختراع در آشکارسازی دانش فنی. مطالعات ملی کتابداری و سازمان‌دهی اطلاعات، 27 (3)، 147-159.

https://sid.ir/paper/224227/fa

  • شجاعی کاریزکی، شایسته، شاپوری، سودابه، و زارعی، هاجر (1400). بررسی روش‌های داده‌کاوی در تصمیم‌گیری مدیران (مطالعه موردی: شهرداری تهران). علوم و فنون مدیریت اطلاعات، 7 (4)، 193-114.

https://doi.org/10.22091/stim.2021.6277.1487

  • صدیقی، مهری (1393). بررسی کاربرد روش هم رخدادی واژگان در ترسیم ساختار حوزه‌های موضوعی علمی (مطالعه موردی: حوزه اطلاع‌سنجی). پژوهشنامه پردازش و مدیریت اطلاعات، 30 (2)، 396-373.

https://sid.ir/paper/131088/fa

  • عابدی جعفری، حسن، ابویی اردکان، محمد، آقازاده، فتاح. (1390). ترسیم نقشه علم مدیریت شهری بر مبنای طبقه‌بندی‌های موضوعی پایگاه استنادی علوم (آی‌اس‌آی). مدیریت دولتی، 3(7)، 138-131.

https://dor.isc.ac/dor/20.1001.1.20085877.1390.3.7.8.9

  • عصاره، فریده، سهیلی، فرامرز، و منصوری، علی (1393). علم‌سنجی و دیداری‌سازی اطلاعات. اصفهان: انتشارات دانشگاه اصفهان.
  • کاتبی، فاطمه (1393). تحلیل هم رخدادی واژگان مدیریت دانش در پایگاه وب او ساینس در سال‌های 1993 لغایت 2012 به‌منظور دیداری‌سازی واژگان تشکیل‌دهنده زیرساخت این حوزه (پایان‌نامه کارشناسی ارشد علوم اطلاعات، کتاب داری و دانش شناسی). دانشکده علوم تربیتی و روانشناسی، دانشگاه شهید چمران اهواز، ایران.
  • نوروزی چاکلی، عبدالرضا. (1390). آشنایی با علم‌سنجی (مبانی، مفاهیم، روابط و ریشهها)، تهران: انتشارات سمت.
  • Aparicio, G. Iturralde, T. & Maseda, A. (2019). Conceptual structure and perspectives on entrepreneurship education research: A bibliometric review. European research on management and business economics, 25(3), 105-113.

https://doi.org/10.1016/j.iedeen.2019.04.003

  • Cahlik, T. (2000). Comparison of the maps of science. Scientometrics, 49(3), 373-387.

https://doi.org/10.1023/A:1010581421990

  • Cobo, M. J. Lopez-Herrera, A. G. & Herrera-Viedma, E. (2011). An approach fordetecting, quantifying, and visualizing the evolution of a research field: A Practical application to the fuzzy set’s theory field. Journal of Informetrics, 5 (1), 146-166.

https://doi.org/10.1016/j.joi.2010.10.002

  • Ellegaard, O. & Wallin, J. A. (2015). The bibliometric analysis of scholarly production: How great is the impact? Scientometrics, 105, 1809-1831.

https://doi.org/10.1007/s11192-015-1645-z

  • Holmberg, K. Huvila, I. Kronqvist-Berg, M. & Widén-Wulff, G. (2009). What is library 2.0? Journal of Documentation, 65(4), 668-681.

https://doi.org/10.1108/00220410910970294

  • Hu, C. P. Deng, S. L. & Liu, G. Y. (2013). A co-word analysis of library and information science in China. Scientometrics, 97(1), 369- 382.

https://doi.org/10.1007/s11192-013-1076-7

  • Jiang, Y. Ritchie, B. W. & Benckendorff, P. (2017). Bibliometric visualisation: An application in tourism crisis and disaster management research. Current Issues in Tourism, 22(16), 1925-1957.

https://doi.org/10.1080/13683500.2017.1408574

  • Kong, L. Liu, Zh. Wu, J. (2020). A systematic review of big data-based urban sustainability research: State-of-the-science and future directions. Journal of Cleaner Production, 273, 123142.

https://doi.org/10.1016/j.jclepro.2020.123142

  • Law, J. & Whittaker, J. (1992). Mapping acidification research: A test of the co-word method. Scientometrics, 23(3), 417-461.

https://doi.org/10.1007/BF02029807

  • Leydesdorff, L. (1987). Various methods for the mapping of science. Scientometrics, 11 (5-6), 291-320

https://doi.org/10.1007/BF02279351

  • Liao, H. Tang, M. Luo, L. Li, C. Chiclana, F. & Zeng, X. J. (2018). A bibliometric analysis and visualization of medical big data research. Sustainability, 10(1), 166.

https://doi.org/10.3390/su10010166

  • Liu, G. Hu, J. & Wang, H. (2012). A Co-word analysis of digital library field in china. Scientometrics, 91 (1), 203-217.

https://doi.org/10.1007/s11192-011-0586-4

  • Milojevic, S. Sugimoto, C. R. & Yan, E. (2011). The cognitive structure of library and information science: Analysis of article title words. Journal of the American Society for Information Science and Technology, 62 (10), 1933-1953.

https://doi.org/10.1002/asi.21602

  • Ravikumar ., Agrahari ., & Singh, S. N. (2015). Mapping the intellectual structure of scientometrics: a co-word analysis of the journal. Scientometrics (2005–2010). Scientometrics, 102 (1), 929-955.

https://doi.org/10.1007/s11192-014-1402-8

  • Sagl, G. Resch, B. Hawelka, B. & Beinat, E. (2012). From Social Sensor Data to Collective Human Behaviour Patterns: Analysing and Visualising Spatio-Temporal Dynamics in Urban Environments. Paper presented at GI_Forum 2012, Salzburg, Austria.

https://www.researchgate.net/publication/233379523_From_Social_Sensor_Data_to_Collective_Human_Behaviour_Patterns_Analysing_and_Visualising_Spatio-Temporal_Dynamics_in_Urban_Environments

  • Weerasekara, S. Lu, Z. Ozek, B. Isaacs, J. & Kamarthi, S. (2022). Trends in Adopting Industry 4.0 for Asset Life Cycle Management for Sustainability: A Keyword Co- Occurrence Network Review and Analysis. Sustainability, 14 (19), 12233.

https://doi.org/10.3390/su141912233

  • Whittaker, J. (1989). Creativity and conformity in science: Titles, keywords, and co-word analysis. Social Studies of Science, 19 (3), 473-496.

https://doi.org/10.1177/030631289019003004

  • Yin, R. Yi, T. Mo, Y., Chen, Zh., Liu, Y., Fang, J., & Yang, K. (2009). Hotspot for study in UML of China: Co-word analysis. International Conference on Management of e-Commerce and e-Government. Nanchang: China.

https://doi.org/10.1109/ICMeCG.2009.92

https://doi.org/10.1145/2948649.2948656

  • Zong, Q., Shen, H., Yuan, Q., Hu, X., Hou, Z., & Deng, S. (2013). Doctoral dissertations of library and information science in china: a co-word analysis. Scientometrics, 94(2) 781-799.

https://doi.org/10.1007/s11192-012-0799-1