py4j protocol py4jjavaerror an error occurred while calling o45 load

github.com › delta-io › delta › issues › 1614

[Question] py4j.protocol.Py4JJavaError: An error occurred while calling o38.applySchemaToPythonRDD · Issue #1614 · delta-io/delta

February 24, 2023 - Bug Getting Incompatible Class with the most recent spark and delta-spark versions for all of my unit tests. I run my tests with: python -m pytest tests/unit The error: E py4j.protocol.Py4JJavaErro...

Author aimtsou

Microsoft Learn

learn.microsoft.com › en-us › answers › questions › 695496 › py4jjavaerror-an-error-occurred-while-calling

Py4JJavaError: An error occurred while calling - Microsoft Q&A

January 14, 2022 - /databricks/spark/python/pyspark/sql/utils.py in deco(*a, **kw) 115 def deco(*a, **kw): 116 try: --> 117 return f(*a, **kw) 118 except py4j.protocol.Py4JJavaError as e: 119 converted = convert_exception(e.java_exception)

Discussions

python - Py4JJavaError: An error occurred while calling - Stack Overflow

I am new to PySpark. I have been writing my code with a test sample. Once I run the code on the larger file(3gb compressed). My code is only doing some filtering and joins. I keep getting errors More on stackoverflow.com

stackoverflow.com

python - How to resolve this error: Py4JJavaError: An error occurred while calling o70.showString? - Stack Overflow

Communities for your favorite technologies. Explore all Collectives · Stack Overflow for Teams is now called Stack Internal. Bring the best of human thought and AI automation together at your work More on stackoverflow.com

stackoverflow.com

python 3.x - py4j.protocol.py4jjavaerror: an error occurred while calling o36.load. : java.lang.noclassdeffounderror: scala/$less$colon$less - Stack Overflow

When I want to read the data from snowflake and mssql systems through using pyspark by creating df, I am getting this error py4j.protocol.Py4JJavaError: An error occurred while calling o36.load. : ... More on stackoverflow.com

stackoverflow.com

python - Py4JJavaError: An error occurred while calling o41.load. : java.lang.ClassNotFoundException: - Stack Overflow

3 Py4JJavaError: An error occurred while calling o45.load. : java.lang.NoClassDefFoundError: org/apache/spark/sql/sources/v2/StreamWriteSupport · 0 Py4JError: An error occurred while calling o230.and More on stackoverflow.com

stackoverflow.com

December 19, 2022

stackoverflow.com › questions › 64379644 › py4jjavaerror-an-error-occurred-while-calling-o45-load-java-lang-noclassdeff

docker - Py4JJavaError: An error occurred while calling o45.load. : java.lang.NoClassDefFoundError: org/apache/spark/sql/sources/v2/StreamWriteSupport - Stack Overflow

1 of 1

I found what was the problem. I need to add "kafka-client" jar file as well in my packages directory.

stackoverflow.com › questions › 54546513 › py4jjavaerror-an-error-occurred-while-calling

python - Py4JJavaError: An error occurred while calling - Stack Overflow

community.cloudera.com › t5 › Support-Questions › py4j-protocol-Py4JJavaError-in-pyspark-while-reading-file › m-p › 228902

1 of 2

This is a current issue with pyspark 2.4.0 installed via conda. You'll want to downgrade to pyspark 2.3.0 via conda prompt or Linux terminal:

    conda install pyspark=2.3.0

2 of 2

-1

You may not have right permissions.

I have the same problem when I use a docker image jupyter/pyspark-notebook to run an example code of pyspark, and it was solved by using root within the container.

Anyone also use the image can find some tips here.

Cloudera Community

py4j.protocol.Py4JJavaError in pyspark while readi... - Cloudera Community - 228902

September 16, 2022 - py4j.protocol.Py4JJavaError: An error occurred while calling o32.load.: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.hadoop.fs.s3a.S3AFileSystem not found<br>

stackoverflow.com › questions › 70981458 › how-to-resolve-this-error-py4jjavaerror-an-error-occurred-while-calling-o70-sh

python - How to resolve this error: Py4JJavaError: An error occurred while calling o70.showString? - Stack Overflow

1 of 4

before running the above code you can manually set the env variable like this

import os
import sys

os.environ['PYSPARK_PYTHON'] = sys.executable
os.environ['PYSPARK_DRIVER_PYTHON'] = sys.executable

this worked in jupyter notebook for me.

2 of 4

The key is in this part of the error message:

RuntimeError: Python in worker has different version 3.9 than that in driver 3.10, PySpark cannot run with different minor versions. Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set.

You need to have exactly the same Python versions in driver and worker nodes.

Probably a quick solution would be to downgrade your Python version to 3.9 (assuming driver is running on the client you're using).

github.com › JohnSnowLabs › spark-nlp › issues › 8445

py4j.protocol.Py4JJavaError: An error occurred while calling z:com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader.getDownloadSize. · Issue #8445 · JohnSnowLabs/spark-nlp

May 15, 2022 - Description i try download the pre-trained model finBERT, but i have this erro py4j.protocol.Py4JJavaError: An error occurred while calling z:com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader.getDownloadSize. code sequenceClassifi...

stackoverflow.com › questions › 74608770 › py4j-protocol-py4jjavaerror-an-error-occurred-while-calling-o36-load-java-la

python 3.x - py4j.protocol.py4jjavaerror: an error occurred while calling o36.load. : java.lang.noclassdeffounderror: scala/$less$colon$less - Stack Overflow

Find elsewhere

Google Bing Mojeek

stackoverflow.com › questions › 74845688 › py4jjavaerror-an-error-occurred-while-calling-o41-load-java-lang-classnotfou

python - Py4JJavaError: An error occurred while calling o41.load. : java.lang.ClassNotFoundException: - Stack Overflow

December 19, 2022 - Py4JJavaError Traceback (most recent call last) <ipython-input-22-59ae75a30984> in <module> ----> 1 df=spark.read.format("xml").option("rowTag","Root").load("/content/spark_/sample_corrupted.xml") 3 frames /usr/local/lib/python3.8/dist-packages/py4j/protocol.py in get_return_value(answer, gateway_client, target_id, name) 324 value = OUTPUT_CONVERTER[type](answer[2:], gateway_client) 325 if answer[1] == REFERENCE_TYPE: --> 326 raise Py4JJavaError( 327 "An error occurred while calling {0}{1}{2}.\n".

github.com › jupyterlab › jupyterlab › issues › 16715

Py4JJavaError: An error occurred while calling o71.showString. · Issue #16715 · jupyterlab/jupyterlab

August 24, 2024 - ----> 2 df.show() 3 df.printSchema() ~\anaconda3\lib\site-packages\pyspark\sql\dataframe.py in show(self, n, truncate, vertical) 945 name | Bob 946 """ --> 947 print(self._show_string(n, truncate, vertical)) 948 949 def _show_string( ~\anaconda3\lib\site-packages\pyspark\sql\dataframe.py in _show_string(self, n, truncate, vertical) 963 964 if isinstance(truncate, bool) and truncate: --> 965 return self._jdf.showString(n, 20, vertical) 966 else: 967 try: ~\anaconda3\lib\site-packages\py4j\java_gateway.py in __call__(self, *args) 1320 1321 answer = self.gateway_client.send_command(command) -> 13

Author KanataD

Databricks Community

community.databricks.com › t5 › data-engineering › how-to-solve-py4jjavaerror-an-error-occurred-while-calling-o5082 › td-p › 24028

How to solve Py4JJavaError: An error occurred while calling o5082.csv. : org.apache.spark.SparkException: Job aborted. when writing to csv

July 1, 2025 - Solved: Hi , I get the error: Py4JJavaError: An error occurred while calling o5082.csv. : org.apache.spark.SparkException: Job aborted. when - 24028

Mark Needham

markhneedham.com › blog › 2015 › 08 › 04 › spark-pysparkhadoop-py4j-protocol-py4jjavaerror-an-error-occurred-while-calling-o23-load-org-apache-hadoop-ipc-remoteexception-server-ipc-version-9-cannot-communicate-with-client-version-4

Spark: pyspark/Hadoop - py4j.protocol.Py4JJavaError: An error occurred while calling o23.load.: org.apache.hadoop.ipc.RemoteException: Server IPC version 9 cannot communicate with client version 4 | Mark Needham

August 4, 2015 - Traceback (most recent call last): File "/Users/markneedham/projects/neo4j-spark-chicago/fbi_spark.py", line 11, in <module> sqlContext.load(source="com.databricks.spark.csv", header="true", path = file).registerTempTable("crimes") File "/Users/markneedham/projects/neo4j-spark-chicago/spark-1.3.0-bin-hadoop1/python/pyspark/sql/context.py", line 482, in load df = self._ssql_ctx.load(source, joptions) File "/Users/markneedham/projects/neo4j-spark-chicago/spark-1.3.0-bin-hadoop1/python/lib/py4j-0.8.2.1-src.zip/py4j/java_gateway.py", line 538, in __call__ File "/Users/markneedham/projects/neo4j-spark-chicago/spark-1.3.0-bin-hadoop1/python/lib/py4j-0.8.2.1-src.zip/py4j/protocol.py", line 300, in get_return_value py4j.protocol.Py4JJavaError: An error occurred while calling o23.load.

Dataiku Community

community.dataiku.com › questions & discussions › general

Pyspark python issue:Py4JJavaError: An error occurred while calling o59.classForName. — Dataiku Community

March 21, 2024 - : java.lang.ClassNotFoundException: com.dataiku.dip.spark.StdDataikuSparkContext at java.net.URLClassLoader.findClass(URLClassLoader.java:387) at java.lang.ClassLoader.loadClass(ClassLoader.java:418) at java.lang.ClassLoader.loadClass(ClassLoader.java:351) at java.lang.Class.forName0(Native Method) at java.lang.Class.forName(Class.java:348) at org.apache.spark.util.Utils$.classForName(Utils.scala:218) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) at sun.reflect.DelegatingMethodAccessorImpl.invoke(

github.com › crealytics › spark-excel › issues › 242

py4j.protocol.Py4JJavaError: An error occurred while calling o83.load. : java.lang.NoClassDefFoundError: org/apache/commons/compress/utils/InputStreamStatistics · Issue #242 · nightscape/spark-excel

May 3, 2020 - I am trying to load a very simple excel file. I am using version 0.11.1 on pyspark 2.4.3. There doesn't seem to be a problem with the options I am providing since I am referring to the docs of v0.11.1. I am getting the following error: (...

Author anishsatalkar

github.com › JohnSnowLabs › spark-nlp › issues › 846

Py4JJavaError: An error occurred while calling z:com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader · Issue #846 · JohnSnowLabs/spark-nlp

April 5, 2020 - There was an error while loading. Please reload this page · Py4JJavaError: An error occurred while calling z:com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader.getDownloadSize. : java.lang.NoSuchMethodError: 'org.json4s.JsonAST$JValue org.json4s.jackson.JsonMethods$.parse(org.json4s...

Author ganga7445

stackoverflow.com › questions › 61357118 › pyspark-stringindexer-error-py4j-protocol-py4jjavaerror-an-error-occurred-wh

python 3.x - (PySpark) StringIndexer Error: py4j.protocol.Py4JJavaError: An error occurred while calling o46.fit - Stack Overflow

April 22, 2020 - py4j.protocol.Py4JJavaError: An error occurred while calling o45.fit.

Cloudera Community

community.cloudera.com › t5 › Support-Questions › py4j-protocol-Py4JJavaError-An-error-occurred-while-calling › m-p › 333543

py4j.protocol.Py4JJavaError: An error occurred whi... - Cloudera Community - 333543

January 11, 2022 - raise Py4JJavaError( py4j.protocol.Py4JJavaError: An error occurred while calling o76.saveAsTable. : org.apache.spark.SparkException: Job aborted.

Databricks Community

community.databricks.com › t5 › data-engineering › azure-databrick-throwing-py4jjavaerror-an-error-occurred-while › td-p › 17223

Azure databrick throwing 'Py4JJavaError: An error occurred while calling o267._run.' error while calling one notebook from another notebook. Has someone come across such error? Can some one suggest the solution if faced similar issue.

May 13, 2022 - Solved: 'Py4JJavaError: An error occurred while calling o267._run.' - 17223

Databricks Community

community.databricks.com › t5 › data-engineering › py4j-protocol-py4jjavaerror-an-error-occurred-while-calling-o359 › td-p › 53933

py4j.protocol.Py4JJavaError: An error occurred whi... - Databricks Community - 53933

October 17, 2025 - from py4j.protocol import Py4JError, Py4JJavaError try: spark.sql.(query) except Exception as e: ## some code except Py4JError as e: ## some code except Py4JJavaError as e: ## some code

reddit.com › r/apachespark › running pyspark gives py4jjavaerror

r/apachespark on Reddit: Running pyspark gives Py4JJavaError

October 19, 2024 -

Hi All, i just installed Pyspark in my laptop and im facing this error while trying to run the below code, These are my envionment variables:

HADOOP_HOME = C:\Programs\hadoop

JAVA_HOME = C:\Programs\Java

PYSPARK_DRIVER_PYTHON = C:\Users\Asus\AppData\Local\Programs\Python\Python313\python.exe

PYSPARK_HOME = C:\Users\Asus\AppData\Local\Programs\Python\Python313\python.exe

PYSPARK_PYTHON = C:\Users\Asus\AppData\Local\Programs\Python\Python313\python.exe

SPARK_HOME = C:\Programs\Spark

from pyspark.sql import SparkSession

spark = SparkSession.builder.master("local").appName("PySpark Installation Test").getOrCreate()
df = spark.createDataFrame([(1, "Hello"), (2, "World")], ["id", "message"])
df.show()

Error logs:

Py4JJavaError                             Traceback (most recent call last)
Cell In[1], line 5
      3 spark = SparkSession.builder.master("local").appName("PySpark Installation Test").getOrCreate()
      4 df = spark.createDataFrame([(1, "Hello"), (2, "World")], ["id", "message"])
----> 5 df.show()

File , in DataFrame.show(self, n, truncate, vertical)
    887 def show(self, n: int = 20, truncate: Union[bool, int] = True, vertical: bool = False) -> None:
    888     """Prints the first ``n`` rows to the console.
    889 
    890     .. versionadded:: 1.3.0
   (...)
    945     name | Bob
    946     """
--> 947     print(self._show_string(n, truncate, vertical))

File , in DataFrame._show_string(self, n, truncate, vertical)
    959     raise PySparkTypeError(
    960         error_class="NOT_BOOL",
    961         message_parameters={"arg_name": "vertical", "arg_type": type(vertical).__name__},
    962     )
    964 if isinstance(truncate, bool) and truncate:
--> 965     return self._jdf.showString(n, 20, vertical)
    966 else:
    967     try:

File , in JavaMember.__call__(self, *args)
   1316 command = proto.CALL_COMMAND_NAME +\
   1317     self.command_header +\
   1318     args_command +\
   1319     proto.END_COMMAND_PART
   1321 answer = self.gateway_client.send_command(command)
-> 1322 return_value = get_return_value(
   1323     answer, self.gateway_client, self.target_id, self.name)
   1325 for temp_arg in temp_args:
   1326     if hasattr(temp_arg, "_detach"):

File , in capture_sql_exception.<locals>.deco(*a, **kw)
    177 def deco(*a: Any, **kw: Any) -> Any:
    178     try:
--> 179         return f(*a, **kw)
    180     except Py4JJavaError as e:
    181         converted = convert_exception(e.java_exception)

File , in get_return_value(answer, gateway_client, target_id, name)
    324 value = OUTPUT_CONVERTER[type](answer[2:], gateway_client)
    325 if answer[1] == REFERENCE_TYPE:
--> 326     raise Py4JJavaError(
    327         "An error occurred while calling {0}{1}{2}".
    328         format(target_id, ".", name), value)
    329 else:
    330     raise Py4JError(
    331         "An error occurred while calling {0}{1}{2}. Trac{3}\n".
    332         format(target_id, ".", name, value))

Py4JJavaError: An error occurred while calling o43.showString.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 0.0 failed 1 times, most recent failure: Lost task 0.0 in stage 0.0 (TID 0) (Bat-Computer executor driver): org.apache.spark.SparkException: Python worker exited unexpectedly (crashed)
at org.apache.spark.api.python.BasePythonRunner$ReaderIterator$$anonfun$1.applyOrElse(PythonRunner.scala:612)
at org.apache.spark.api.python.BasePythonRunner$ReaderIterator$$anonfun$1.applyOrElse(PythonRunner.scala:594)
at scala.runtime.AbstractPartialFunction.apply(AbstractPartialFunction.scala:38)
at org.apache.spark.api.python.PythonRunner$$anon$3.read(PythonRunner.scala:789)
at org.apache.spark.api.python.PythonRunner$$anon$3.read(PythonRunner.scala:766)
at org.apache.spark.api.python.BasePythonRunner$ReaderIterator.hasNext(PythonRunner.scala:525)
at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:37)
at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:491)
at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:460)
at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:460)
at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)
at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)
at org.apache.spark.sql.execution.WholeStageCodegenEvaluatorFactory$WholeStageCodegenPartitionEvaluator$$anon$1.hasNext(WholeStageCodegenEvaluatorFactory.scala:43)
at org.apache.spark.sql.execution.SparkPlan.$anonfun$getByteArrayRdd$1(SparkPlan.scala:388)
at org.apache.spark.rdd.RDD.$anonfun$mapPartitionsInternal$2(RDD.scala:893)
at org.apache.spark.rdd.RDD.$anonfun$mapPartitionsInternal$2$adapted(RDD.scala:893)
at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:367)
at org.apache.spark.rdd.RDD.iterator(RDD.scala:331)
at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:93)
at org.apache.spark.TaskContext.runTaskWithListeners(TaskContext.scala:166)
at org.apache.spark.scheduler.Task.run(Task.scala:141)
at org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$4(Executor.scala:620)
at org.apache.spark.util.SparkErrorUtils.tryWithSafeFinally(SparkErrorUtils.scala:64)
at org.apache.spark.util.SparkErrorUtils.tryWithSafeFinally$(SparkErrorUtils.scala:61)
at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:94)
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:623)
at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1144)
at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:642)
at java.base/java.lang.Thread.run(Thread.java:1583)
Caused by: java.io.EOFException
at java.base/java.io.DataInputStream.readFully(DataInputStream.java:210)
at java.base/java.io.DataInputStream.readInt(DataInputStream.java:385)
at org.apache.spark.api.python.PythonRunner$$anon$3.read(PythonRunner.scala:774)
... 26 more

Driver stacktrace:
at org.apache.spark.scheduler.DAGScheduler.failJobAndIndependentStages(DAGScheduler.scala:2856)
at org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2(DAGScheduler.scala:2792)
at org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2$adapted(DAGScheduler.scala:2791)
at scala.collection.mutable.ResizableArray.foreach(ResizableArray.scala:62)
at scala.collection.mutable.ResizableArray.foreach$(ResizableArray.scala:55)
at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:49)
at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:2791)
at org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1(DAGScheduler.scala:1247)
at org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1$adapted(DAGScheduler.scala:1247)
at scala.Option.foreach(Option.scala:407)
at org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:1247)
at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:3060)
at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2994)
at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2983)
at org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:49)
at org.apache.spark.scheduler.DAGScheduler.runJob(DAGScheduler.scala:989)
at org.apache.spark.SparkContext.runJob(SparkContext.scala:2393)
at org.apache.spark.SparkContext.runJob(SparkContext.scala:2414)
at org.apache.spark.SparkContext.runJob(SparkContext.scala:2433)
at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:530)
at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:483)
at org.apache.spark.sql.execution.CollectLimitExec.executeCollect(limit.scala:61)
at org.apache.spark.sql.Dataset.collectFromPlan(Dataset.scala:4333)
at org.apache.spark.sql.Dataset.$anonfun$head$1(Dataset.scala:3316)
at org.apache.spark.sql.Dataset.$anonfun$withAction$2(Dataset.scala:4323)
at org.apache.spark.sql.execution.QueryExecution$.withInternalError(QueryExecution.scala:546)
at org.apache.spark.sql.Dataset.$anonfun$withAction$1(Dataset.scala:4321)
at org.apache.spark.sql.execution.SQLExecution$.$anonfun$withNewExecutionId$6(SQLExecution.scala:125)
at org.apache.spark.sql.execution.SQLExecution$.withSQLConfPropagated(SQLExecution.scala:201)
at org.apache.spark.sql.execution.SQLExecution$.$anonfun$withNewExecutionId$1(SQLExecution.scala:108)
at org.apache.spark.sql.SparkSession.withActive(SparkSession.scala:900)
at org.apache.spark.sql.execution.SQLExecution$.withNewExecutionId(SQLExecution.scala:66)
at org.apache.spark.sql.Dataset.withAction(Dataset.scala:4321)
at org.apache.spark.sql.Dataset.head(Dataset.scala:3316)
at org.apache.spark.sql.Dataset.take(Dataset.scala:3539)
at org.apache.spark.sql.Dataset.getRows(Dataset.scala:280)
at org.apache.spark.sql.Dataset.showString(Dataset.scala:315)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:75)
at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:52)
at java.base/java.lang.reflect.Method.invoke(Method.java:580)
at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:374)
at py4j.Gateway.invoke(Gateway.java:282)
at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
at py4j.commands.CallCommand.execute(CallCommand.java:79)
at py4j.ClientServerConnection.waitForCommands(ClientServerConnection.java:182)
at py4j.ClientServerConnection.run(ClientServerConnection.java:106)
at java.base/java.lang.Thread.run(Thread.java:1583)
Caused by: org.apache.spark.SparkException: Python worker exited unexpectedly (crashed)
at org.apache.spark.api.python.BasePythonRunner$ReaderIterator$$anonfun$1.applyOrElse(PythonRunner.scala:612)
at org.apache.spark.api.python.BasePythonRunner$ReaderIterator$$anonfun$1.applyOrElse(PythonRunner.scala:594)
at scala.runtime.AbstractPartialFunction.apply(AbstractPartialFunction.scala:38)
at org.apache.spark.api.python.PythonRunner$$anon$3.read(PythonRunner.scala:789)
at org.apache.spark.api.python.PythonRunner$$anon$3.read(PythonRunner.scala:766)
at org.apache.spark.api.python.BasePythonRunner$ReaderIterator.hasNext(PythonRunner.scala:525)
at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:37)
at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:491)
at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:460)
at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:460)
at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)
at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)
at org.apache.spark.sql.execution.WholeStageCodegenEvaluatorFactory$WholeStageCodegenPartitionEvaluator$$anon$1.hasNext(WholeStageCodegenEvaluatorFactory.scala:43)
at org.apache.spark.sql.execution.SparkPlan.$anonfun$getByteArrayRdd$1(SparkPlan.scala:388)
at org.apache.spark.rdd.RDD.$anonfun$mapPartitionsInternal$2(RDD.scala:893)
at org.apache.spark.rdd.RDD.$anonfun$mapPartitionsInternal$2$adapted(RDD.scala:893)
at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:367)
at org.apache.spark.rdd.RDD.iterator(RDD.scala:331)
at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:93)
at org.apache.spark.TaskContext.runTaskWithListeners(TaskContext.scala:166)
at org.apache.spark.scheduler.Task.run(Task.scala:141)
at org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$4(Executor.scala:620)
at org.apache.spark.util.SparkErrorUtils.tryWithSafeFinally(SparkErrorUtils.scala:64)
at org.apache.spark.util.SparkErrorUtils.tryWithSafeFinally$(SparkErrorUtils.scala:61)
at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:94)
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:623)
at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1144)
at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:642)
... 1 more
Caused by: java.io.EOFException
at java.base/java.io.DataInputStream.readFully(DataInputStream.java:210)
at java.base/java.io.DataInputStream.readInt(DataInputStream.java:385)
at org.apache.spark.api.python.PythonRunner$$anon$3.read(PythonRunner.scala:774)
... 26 more~\Workspace\Projects\Python\PySpark\MyFirstPySpark_Proj\spark_venv\Lib\site-packages\pyspark\sql\dataframe.py:947~\Workspace\Projects\Python\PySpark\MyFirstPySpark_Proj\spark_venv\Lib\site-packages\pyspark\sql\dataframe.py:965~\Workspace\Projects\Python\PySpark\MyFirstPySpark_Proj\spark_venv\Lib\site-packages\py4j\java_gateway.py:1322~\Workspace\Projects\Python\PySpark\MyFirstPySpark_Proj\spark_venv\Lib\site-packages\pyspark\errors\exceptions\captured.py:179~\Workspace\Projects\Python\PySpark\MyFirstPySpark_Proj\spark_venv\Lib\site-packages\py4j\protocol.py:326.\ne:\n